DE19921122C1 - Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals - Google Patents
Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten AudiosignalsInfo
- Publication number
- DE19921122C1 DE19921122C1 DE19921122A DE19921122A DE19921122C1 DE 19921122 C1 DE19921122 C1 DE 19921122C1 DE 19921122 A DE19921122 A DE 19921122A DE 19921122 A DE19921122 A DE 19921122A DE 19921122 C1 DE19921122 C1 DE 19921122C1
- Authority
- DE
- Germany
- Prior art keywords
- spectral
- spectral coefficients
- subband
- coefficients
- following
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Abstract
Bei einem Verfahren zum Verschleiern eines Fehlers in einem codierten Audiosignal wird ein Satz von Spektralkoeffizienten in mindestens zwei Subbändern unterteilt, woraufhin die Subbänder einer Rückwärtstransformation unterzogen werden. Für jedes Quasi-Zeitsignal eines Subbandes wird eine eigene Prädiktion durchgeführt, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den aktuellen Satz folgenden Satzes von Spektralkoeffizienten zu erhalten. Eine Vorwärtstransformation des Zeitsignals jedes Subbandes liefert geschätzte Spektralkoeffizienten, die anstatt fehlerhafter Spektralkoeffizienten eines folgenden Satzes von Spektralkoeffizienten verwendet werden können, um beispielsweise Übertragungsfehler zu verschleiern. Durch das subbandmäßige Transformieren wird einerseits Unabhängigkeit von Transformationseigenschaften, wie z. B. Blocklänge, Fenstertyp oder MDCT-Algorithmus, erreicht, während andererseits eine spektralmäßige Verarbeitung für die Fehlerverschleierung gewahrt bleibt. Damit können spektrale Eigenschaften von Audiosignalen auch bei der Fehlerverschleierung berücksichtigt werden.
Description
Die vorliegende Erfindung bezieht sich auf das Codieren bzw.
Decodieren von Audiosignalen und insbesondere auf die Ver
schleierung von Fehlern ("Error Concealment") in digital
codierten Audiosignalen.
Mit zunehmender Verbreitung moderner Audiocodierer und ent
sprechender Audiodecodierer, die nach einem der MPEG-Stan
dards arbeiten, hat die Übertragung von codierten Audiosig
nalen über Funknetze oder über leitungsgebundene Netze, wie
z. B. das Internet, bereits eine große Bedeutung erlangt.
Bei der Übertragung von codierten Audiosignalen mittels
digitalem Rundfunk aber auch beim Übertragen von Audiosigna
len über leitungsgebundene Netze liegt ein nicht-idealer
Übertragungskanal vor, der dazu führen kann, daß codierte
Audiosignale während der Übertragung gestört werden. Daher
stellt sich decodiererseitig die Aufgabe, wie mit Übertra
gungsfehlern umgegangen werden soll, bzw. wie Übertragungs
fehler "verschleiert" werden sollen. Die Fehlerverschlei
erung dient dazu, Übertragungsfehler auf irgendeine Art und
Weise zu manipulieren, um den subjektiven Höreindruck eines
solchen fehlerbehafteten decodierten Audiosignales zu ver
bessern.
Mehrere Fehlerverschleierungsverfahren sind bereits bekannt.
Die einfachste Art der Fehlerverschleierung besteht in dem
Verfahren der Stummschaltung, das auch als "Muting" bezeich
net wird. Erkennt ein Decodierer, daß Daten fehlen oder feh
lerhaft sind, so schaltet derselbe die Wiedergabe ab. Die
fehlenden Daten werden somit durch ein Null-Signal ersetzt.
Damit wird vermieden, daß aufgrund eines Übertragungsfehlers
zu laute bzw. unangenehme Geräusche eines Decodierers ausge
geben werden. Aufgrund psychoakustischer Effekte wird dieses
plötzliche Abfallen und Ansteigen der Signalenergie, wenn
der Decodierer wieder fehlerfreie Daten ausgibt, dennoch als
unangenehm empfunden.
Ein anderes bekanntes Verfahren, das den plötzlichen Abfall
und Wiederanstieg der Signalenergie vermeidet, ist das Ver
fahren der Datenwiederholung. Fällt beispielsweise ein Block
oder mehrere Blöcke von Audiodaten aus, so wird ein Teil der
zuletzt gesendeten Daten in einer Schleife wiederholt, bis
wieder fehlerfreie, d. h. intakte Audiodaten vorliegen. Die
ses Verfahren führt jedoch zu störenden Artefakten. Werden
nur kurze Teile des Audiosignals wiederholt, so klingt das
repetierte Signal unabhängig vom Orginalsignal maschinenar
tig mit einer Grundfrequenz bei der Wiederholfrequenz. Wer
den längere Teile wiederholt, entstehen bestimmte Echoeffek
te, die ebenfalls als störend empfunden werden.
Bei blockorientierten Transformationscodierern/-decodierern,
bei denen eine spektrale Darstellung eines zeitlichen Audio
signals verwendet wird, würde ferner die Möglichkeit beste
hen, eine spektralwertweise Prädiktion im Falle von fehler
haften Audiodaten durchzuführen. Wird festgestellt, daß
Spektralwerte in einem Block fehlerhaft sind, so können
diese Spektralwerte basierend auf den Spektralwerten eines
vorausgehenden Blocks oder mehrerer vorausgehender Blöcke
prädiziert, d. h. vorhergesagt oder abgeschätzt werden. Die
prädizierten Spektralwerte entsprechen in gewissen Grenzen
den fehlerhaften Spektralwerten, wenn das Audiosignal rela
tiv stationär ist, d. h. wenn das Audiosignal keinen so
schnellen Änderungen der Signaleinhüllenden unterzogen ist.
Wenn beispielsweise ein nach dem MPEG-AAC-Standard (ISO/IEC
13818-7 MPEG-2 Advanced Audio Coding) arbeitendes Verfahren
betrachtet wird, so hat ein normaler Block von codierten
Audiodaten 1024 Spektralwerte. Beim Verfahren der spek
tralwertweisen Prädiktion werden daher 1024 parallel
arbeitende Prädiktoren im Decodierer benötigt, um z. B. im
Falle eines vollständigen Blockausfalls ("Frame Loss")
sämtliche Spektralwerte prädizieren zu können.
Ein Nachteil dieses Verfahrens ist der relativ hohe Rechen
aufwand, der derzeit eine Echtzeit Decodierung eines empfan
genen Multimedia- oder Audiodatensignals unmöglich macht.
Ein weiterer wesentlicher Nachteil dieses Verfahrens wird
durch den verwendeten Transformationsalgorithmus, die modi
fizierte diskrete Cosinustransformation (MDCT), bedingt. Es
ist allgemein bekannt, daß der MDCT-Algorithmus kein ideales
Fourier-Spektrum liefert, sondern ein "Spektrum", das sich
von einem idealen Fourier-Spektrum unterscheidet. Untersu
chungen haben gezeigt, daß z. B. eine Sinus-Zeitfunktion,
die ein Fourier-Spektrum aufweist, das eine einzige Spek
trallinie bei der Frequenz der Sinusfunktion hat, ein MDCT-
"Spektrum" hat, das zwar bei der Frequenz der Sinusfunktion
einen dominierenden Spektralkoeffizienten hat, das jedoch
zusätzlich weitere Spektralkoeffizienten bei anderen Fre
quenzwerten aufweist. Außerdem ist die Höhe eines MDCT-
"Spektrums" einer Sinusfunktion nicht von Block zu Block
gleich, sondern dieselbe schwankt von Block zu Block. Eine
weitere Tatsache ist, daß die MDCT-Transformation nicht
streng energieerhaltend ist. So kann festgehalten werden,
daß die MDCT-Transformation zwar zusammen mit einer inversen
MDCT-Transformation exakt arbeitet, daß jedoch das MDCT-
Spektrum wesentliche Unterschiede zu einem Fourier-Spektrum
hat. Eine spektralwertweise Prädiktion von MDCT-Spektralko
effizienten hat sich daher als unzureichend herausgestellt,
wenn qualitativ hochwertige Anforderungen gestellt werden.
Ein weiterer Nachteil der spektralwertweisen Prädiktion ins
besondere in Verbindung mit modernen Audiocodierverfahren
besteht darin, daß moderne Audiocodierverfahren unterschied
liche Fensterlängen bzw. Fensterformen verwenden. Um zu ver
meiden, daß sich bei schnellen Änderungen des zu codierenden
Audiosignals, d. h. bei Transienten oder Anschlägen, das
durch die Quantisierung der MDCT-Spektralkoeffizienten ein
geführte Quantisierungsrauschen über eine langen Block "ver
schmiert", d. h. daß sogenannte Vorechos auftreten, verwen
den moderne Transformationscodierer bei transienten Audio
signalen, d. h. Audiosignalen mit Anschlägen, kurze Fenster,
um die zeitliche Auflösung auf Kosten der Frequenzauflösung
zu erhöhen. Dies führt aber dazu, daß bei einer spektral
wertweisen Prädiktion ständig sowohl Fensterlänge als auch
Fensterform (es existieren zudem Übergangsfenster, um eine
Fensterung von kurzen zu langen Blöcken und umgekehrt ein
zuleiten) berücksichtigt werden müssen, was ebenfalls zu
einer Verkomplizierung der spektralwertweisen Prädiktion
beiträgt und die Recheneffizienz empfindlich beeinflussen
würde.
Die DE 40 34 017 A1 bezieht sich auf ein Verfahren zum Er
kennen von Fehlern bei der Übertragung von frequenzcodierten
digitalen Signalen. Hierbei wird aus Frequenzkoeffizienten
zurückliegender sowie ggf. zukünftiger Blöcke eine Fehler
funktion gebildet, anhand derer das Auftreten eines Fehlers
ermittelt wird. Ein fehlerhafter Frequenzkoeffizient wird
für die Bewertung nachfolgender Blöcke nicht mehr herange
zogen.
Die DE 197 35 675 A1 offenbart ein Verfahren zum Verschlei
ern von Fehlern in einem Audiodatenstrom. Hierzu wird die
spektrale Energie einer Untergruppe von intakten Audiodaten
berechnet. Nach dem Bilden einer Vorlage für Ersatzdaten
aufgrund der für die Untergruppe der intakten Audiodaten be
rechneten spektralen Energie werden Ersatzdaten für fehler
hafte oder nicht vorhandene Audiodaten, die der Untergruppe
entsprechen, aufgrund der Vorlage erzeugt.
Die Aufgabe der vorliegenden Erfindung besteht darin, eine
präzise und flexible Fehlerverschleierung für Audiosignale
zu schaffen, die mit begrenztem Rechenaufwand implementiert
werden kann.
Diese Aufgabe wird durch ein Verfahren zum Verschleiern ein
es Fehlers nach Patentanspruch 1 und eine Vorrichtung zum
Verschleiern eines Fehlers nach Patentanspruch 12 gelöst.
Eine weitere Aufgabe der vorliegenden Erfindung besteht da
rin, eine fehlerrobuste und flexible Decodierung von Audio
signalen zu schaffen.
Diese Aufgabe wird durch ein Verfahren zum Decodieren eines
codierten Audiosignals nach Patentanspruch 10 und durch eine
Vorrichtung zum Decodieren eines codierten Audiosignals nach
Patentanspruch 13 gelöst.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde,
daß die Nachteile der spektralwertweisen Prädiktion, die in
der Abhängigkeit von dem verwendeten Transformationsalgo
rithmus und in der Abhängigkeit von Fensterform und Block
länge bestehen, dadurch vermieden werden können, daß zur
Fehlerverschleierung eine Prädiktion eingesetzt wird, die im
"Quasi"-Zeitbereich arbeitet. Hierzu wird ein Satz von Spek
tralwerten, der vorzugsweise einem langen Block bzw. einer
Anzahl von kurzen Blöcken entspricht, in Subbänder unter
teilt. Ein Subband des aktuellen Satzes von Spektralkoeffi
zienten kann daraufhin einer Rückwärts-Transformation unter
zogen werden, um ein Zeitsignal zu erhalten, das den Spek
tralkoeffizienten des Subbandes entspricht. Zur Erzeugung
von Schätzwerten für einen darauffolgenden Satz von Spek
tralkoeffizienten wird eine Prädiktion auf der Basis des
Zeitsignals dieses Subbandes durchgeführt.
Es sei darauf hingewiesen, daß diese Prädiktion im Quasi-
Zeitbereich stattfindet, da das zeitliche Signal, auf der
Basis dessen die Prädiktion durchgeführt wird, lediglich das
Zeitsignal eines Subbandes des codierten Audiosignals und
nicht das Zeitsignal des gesamten Spektrums des Audiosignals
ist. Das mittels Prädiktion erzeugte Zeitsignal wird einer
Vorwärtstransformation unterzogen, um geschätzte, d. h. prä
dizierte Spektralkoeffizienten für das Subband des folgenden
Satzes von Spektralkoeffizienten zu erhalten. Wird nun fest
gestellt, daß in dem folgenden Satz von Spektralkoeffizien
ten einer oder mehrere fehlerhafte Spektralkoeffizienten
sind, so können die fehlerhaften Spektralkoeffizienten durch
die geschätzten, d. h. prädizierten, Spektralkoeffizienten
ersetzt werden.
Im Gegensatz zur reinen spektralwertweisen Prädiktion erfor
dert das erfindungsgemäße Verfahren zum Verschleiern von
Fehlern einen geringeren Rechenaufwand, da aufgrund der
Gruppierung von Spektralkoeffizienten Prädiktionen nur noch
für jedes Subband und nicht mehr für jeden Spektralkoeffizi
enten durchgeführt werden müssen. Außerdem liefert das er
findungsgemäße Verfahren eine hohe Flexibilität, da die Ei
genschaften der zu verarbeitenden Signale berücksichtigt
werden können.
Die Fehlerverschleierung gemäß der vorliegenden Erfindung
arbeitet besonders gut für tonale Signale. Es wurde jedoch
herausgefunden, daß tonale Signalanteile eher im niederfre
quenteren Bereich des Spektrums eines Audiosignals auftre
ten, während die höherfrequenten Signalanteile eher nicht
stationär, d. h. rauschhaft, sind. "Rauschhafte Signalan
teile" sind im Sinne der vorliegenden Beschreibung Signal
anteile die wenig stationär sind. Diese rauschhaften Signal
anteile müssen jedoch nicht unbedingt Rauschen im klassi
schen Sinn darstellen, sondern lediglich sich schnell verän
dernde Nutzsignale.
Zur weiteren Reduzierung des Rechenaufwands ermöglicht es
die vorliegende Erfindung daher, lediglich niederfrequentere
Signalanteile einer Prädiktion zu unterziehen, während hö
herfrequentere Signalanteile überhaupt nicht verarbeitet
werden. In anderen Worten ausgedrückt ist es möglich, nur
das bzw. die unteren Subbänder einer Rückwärtstransforma
tion, einer Prädiktion und einer Vorwärtstransformtion zu
unterziehen.
Diese Eigenschaft der vorliegenden Erfindung stellt im Ver
gleich zu einer vollständigen Transformation des gesamten
Audiosignals in den Zeitbereich und einer Prädiktion des ge
samten zeitlichen Audiosignals von Block zu Block unter
Verwendung eines sogenannten "Long-Term"-Prädiktors einen
wesentlichen Vorteil dar, da erfindungsgemäß die Vorteile
der Prädiktion im Zeitbereich mit den Vorteilen der spek
tralen Zerlegung kombiniert werden. Nur die spektrale Zer
legung ermöglicht es, Eigenschaften des Audiosignals, die
von der Frequenz abhängig sind, zu berücksichtigen. Die
Anzahl der Subbänder, die beim Unterteilen des Satzes von
Spektralkoeffizienten erzeugt wird, ist beliebig wählbar.
Werden nur zwei Subbänder gewählt, so ergibt sich bereits
der Vorteil der Berücksichtigung der Tonalität im unteren
Frequenzbereich des Audiosignals. Werden dagegen sehr viele
Subbänder gewählt, so wird der Prädiktor im Quasi-Zeitbe
reich eine relativ kurze Länge haben, derart, daß seine
Verzögerung nicht allzu groß wird. Da die einzelnen Sub
bänder vorzugsweise parallel verarbeitet werden, wären bei
einer Ausführung der vorliegenden Erfindung unter Verwendung
eines festverdrahteten integrierten Schaltkreises viele
parallele Prädiktorschaltungen notwendig.
Wird die vorliegende Erfindung im Zusammenhang mit einem
Transformationscodierer eingesetzt, der unterschiedliche
Blocklängen verwendet, so ergibt sich der Vorteil, daß der
Prädiktor selbst von Blocklänge ("Block Length") und Fen
sterform ("Window Shape") unabhängig ist. Außerdem wird
durch die Rücktransformation die Abhängigkeit von dem
verwendeten Transformationsalgorithmus selbst, die oben
bezüglich der MDCT ausgeführt worden ist, eliminiert. Wei
terhin liefert das erfindungsgemäße Konzept zur Fehlerver
schleierung geschätzte Spektralkoeffizienten, die aufgrund
der Rückwärtstransformation, der Prädiktion im Zeitbereich
und der Vorwärtstransformation phasenrichtig sind, d. h. es
treten keine Phasensprünge im Zeitsignal aufgrund eines
prädizierten Spektralkoeffizienten gegenüber einem Zeitsi
gnal eines vorausgehenden intakten Satzes von Spektral
koeffizienten auf. Damit können tonale Signale derart gut
für fehlerhafte oder fehlende Signalanteile substituiert
werden, daß ein üblicher Hörer in den allermeisten Fällen
nicht einmal merkt, daß ein Fehler aufgetreten ist.
Schließlich eignet sich das erfindungsgemäße Verfahren be
sonders gut für eine Kombination mit einer Fehlerverschlei
erungstechnik, die in der DE 197 35 675 A1 beschrieben ist,
die für die Substitution von rauschhaften Signalanteilen
geeignet ist. Werden tonale Signalanteile eines fehlenden
Blocks durch das erfindungsgemäße Verfahren verschleiert,
und werden rauschhafte Signalanteile durch das eben erwähnte
bekannte Verfahren, daß auf einer Energieähnlichkeit zwi
schen substituierten Daten und intakten Daten aufbaut, kom
biniert, so können vollständig ausgefallene Blöcke nahezu
unhörbar für einen normalen Hörer verschleiert werden.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung
werden nachfolgend bezugnehmend auf die beiliegenden Zeich
nungen detailliert erläutert. Es zeigen:
Fig. 1 einen Decodierer, der eine erfindungsgemäße Fehler
verschleierungseinrichtung aufweist;
Fig. 2 ein detaillierteres Blockschaltbild der Fehlerver
schleierungseinrichtung von Fig. 1;
Fig. 3 ein detaillierteres Blockschaltbild der Fehlerver
schleierungseinrichtung von Fig. 1, die zudem eine
Rauschersetzung aufweist und basierend auf dem
Prädiktionsgewinn arbeitet;
Fig. 4 ein Flußdiagramm für das erfindungsgemäße Verfahren
zur Fehlerverschleierung;
Fig. 5 ein detailliertes Blockschaltbild eines bevorzugten
Ausführungsbeispiels der Fehlerverschleierungsein
richtung für einen MPEG-2 AAC-Decodierer;
Fig. 6 ein detailliertes Blockschaltbild des Prädiktors von
Fig. 5; und
Fig. 7 eine schematische Darstellung der Blockstruktur nach
dem AAC-Standard.
Fig. 1 zeigt ein Blockschaltbild eines Decodierers gemäß ei
nem bevorzugten Ausführungsbeispiel der vorliegenden Erfin
dung. Das in Fig. 1 gezeigte Decodiererblockschaltbild ent
spricht grundsätzlich dem MPEG-2 AAC-Decodierer, wie er im
Standard MPEG-2 AAC 13818-7 festgelegt ist. Das codierte Au
diosignal gelangt zunächst in einen Bitstrom-Demultiplexer
100, um Spektraldaten und Seiteninformationen zu trennen.
Die Huffman-codierten Spektralkoeffizienten werden dann in
einen Huffman-Decodierer 200 eingespeist, um aus den Huff
man-Codewörtern quantisierte Spektralwerte zu erhalten. Die
quantisierten Spektralwerte werden anschließend in einen in
versen Quantisierer 300 eingespeist und anschließend skalen
faktorbandweise mit entsprechenden Skalenfaktoren multipli
ziert. Der erfindungsgemäße Codierer kann im Anschluß an den
inversen Quantisierer 300 mehrere weitere Funktionalitäten
haben, wie z. B. eine Mitte/Seite-Stufe, eine Prädiktor-Stu
fe, eine TNS-Stufe usw. wie es im Standard festgelegt ist.
Gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden
Erfindung umfaßt der Decodierer unmittelbar vor einer Syn
these-Filterbank 400 eine Fehlerverschleierungseinrichtung
500, die erfindungsgemäß arbeitet und dafür sorgt, daß die
Auswirkungen von Übertragungsfehlern in dem codierten Audio
signal, das in den Bitstrom-Demultiplexer 100 eingespeist
wird, gelindert bzw. vollständig unhörbar gemacht werden
können. Anders ausgedrückt bewirkt die Fehlerverschleier
ungseinrichtung 500, daß Übertragungsfehler verschleiert
werden, d. h. daß sie in einem zeitlichen Audiosignal am
Ausgang der Synthese-Filterbank nicht oder nur noch schwach
hörbar sind.
Fig. 2 zeigt ein allgemeines Blockschaltbild der Fehlerver
schleierungseinrichtung 500. Dieselbe umfaßt eine Rückwärts
transformationseinrichtung 502, eine Einrichtung 504 zur Er
zeugung von Schätzwerten sowie eine Einrichtung 506 zur Vor
wärtstransformation. Sowohl die Rückwärtstransformationsein
richtung 502 als auch die Vorwärtstransformationseinrichtung
506 sind abhängig von dem Blocktyp, der gerade vorliegt,
über eine Blocktypleitung 508 steuerbar. Die Fehlerver
schlüsselungseinrichtung 500 umfaßt ferner einen Parallel
zweig, um die eingangsseitigen Spektralkoeffizienten unter
Umgehung der Rückwärtstransformationseinrichtung 502, der
Einrichtung zur Erzeugung von Schätzwerten 504 und der Vor
wärtstransformationseinrichtung 506 direkt vom Eingang zum
Ausgang zu leiten. Dieser Parallelzweig umfaßt eine
Zeitverzögerungsstufe 510, um sicherzustellen, daß hinter
der Vorwärtstransformationseinrichtung 506 vorliegende
geschätzte Spektralkoeffizienten für einen folgenden Block
gleichzeitig mit "realen", unter Umständen fehlerhaften
Spektralkoeffizienten für den folgenden Block an einer
Fehler-Auswahl-Einrichtung 512 anliegen, um eventuell
fehlerhafte Spektralkoeffizienten in den realen Spektralko
effizienten für den folgenden Block durch geschätzte Spek
tralkoeffizienten für den folgenden Block ersetzen zu kön
nen. Diese spektralwertweise Ersetzung ist durch ein
Schaltersymbol 512 in Fig. 2 dargestellt. Es sei darauf
hingewiesen, daß die Fehler-Ersetzungs-Einrichtung 512
entweder spektralwertweise oder block- bzw. satzweise
arbeiten kann. Je nach Anforderung kann dieselbe auch
subbandweise arbeiten. Am Ausgang der Fehler-Ersetzungs-Ein
richtung 512 liegt dann der folgende Satz von Spektral
koeffizienten vor, in dem eventuell ursprünglich fehlerhafte
Spektralkoeffizienten durch geschätzte Spektralkoeffizienten
ersetzt worden sind, d. h. in dem Fehler verschleiert sind.
An dieser Stelle sei darauf hingewiesen, daß das Block
schaltbild, das in Fig. 2 gezeigt ist, lediglich einen Teil
der Fehlerverschleierungseinrichtung 500 darstellt. Diese
Darstellung wurde jedoch aus Übersichtlichkeitsgründen ge
wählt. Wie es in Fig. 5 anhand eines bevorzugten Ausführ
ungsbeispiels der vorliegenden Erfindung näher erläutert
werden wird, ist der in Fig. 2 gezeigten Schaltung eine Ein
richtung zur Unterteilung in Subbänder vorgeschaltet. Analog
dazu ist der Fehler-Ersetzungs-Einrichtung 512 eine Einrich
tung zum Rückgängigmachen der Unterteilung in Subbänder
nachgeschaltet, derart, daß die Filterbank 400 (Fig. 1) ei
nen "normalen" Satz von Spektralkoeffizienten erhält, ohne
von der vorausgegangenen Fehlerverschleierung irgendetwas zu
merken. Die Fehlerverschleierungseinrichtung 500 (Fig. 1)
umfaßt somit eine Mehrzahl von bezugnehmend auf Fig. 2 be
schriebenen Schaltungen, und zwar eine Schaltung für jedes
Subband. Die parallelen Schaltungen sind eingangsseitig
durch die Einrichtung zum Unterteilen verbunden und aus
gangsseitig durch die Einrichtung zum Rückgängigmachen der
Unterteilung, wie es später detailliert ausgeführt wird.
Es wurde bereits früher darauf hingewiesen, daß moderne
Transformationscodierer zur Erhöhung der zeitlichen Auflö
sung im Falle von Transienten in einem zu codierenden Au
diosignal kurze Fenster verwenden. Dabei ist es gebräuch
lich, daß die Anzahl der zeitlichen Abtastwerte bzw. die An
zahl der Spektralkoeffizienten in einem langen Fenster bzw.
Block ein ganzzahliges Vielfaches der Anzahl von zeitlichen
Abtastwerten bzw. Spektralkoeffizienten in einem kurzen Fen
ster bzw. Block darstellt. Ein vorteilhafter Effekt der vor
liegenden Erfindung besteht darin, daß die Einrichtung 504
zur Erzeugung von Schätzwerten unabhängig von der verwen
deten Transformation, von der verwendeten Blocklänge bzw.
von dem verwendeten Fenstertyp arbeiten kann. Daher werden
sowohl die Rückwärtstransformationseinrichtung 502 als auch
die Vorwärtstransformationseinrichtung 506 Blocktyp-abhängig
gesteuert, um der Einrichtung 504 zur Erzeugung von Schätz
werten immer dieselbe Anzahl von zeitlichen Abtastwerten zu
zuführen bzw. von derselben abzuführen.
Zur weiteren Veranschaulichung dieser Eigenschaft wird nach
folgend auf Fig. 7 Bezug genommen, um die Situation für
MPEG-2 AAC darzustellen. Fig. 7 umfaßt eine Zeitachse 700,
bezüglich der die Ausdehnung eines langen Blocks 702 darge
stellt ist. Ein langer Block umfaßt 2048 Abtastwerte, woraus
sich 1024 Spektralkoeffizienten ergeben, wenn eine 50%-ige
Überlappung der Fenster eingesetzt wird, wie es bekannt ist.
Hintergründe zur verwendeten modifizierten diskreten Cosi
nus-Transformation (MDCT) und der Fensterüberlappung finden
sich in dem bereits zitierten Standard. In Fig. 7 sind fer
ner acht kurze Blöcke 704 eingezeichnet, von denen jeder 256
Abtastwerte aufweist, um wieder aufgrund der 50%-igen Über
lappung 128 Spektralkoeffizienten zu ergeben. Aus Übersicht
lichkeitsgründen wurde in Fig. 7 die Überlappung der kurzen
Blöcke sowie die Überlappung des langen Blocks mit einem
vorausgehenden langen Block bzw. mit einem vorausgehenden
oder einem nachgeschalteten Start- bzw. Stoppfenster nicht
eingezeichnet. Auf jeden Fall ist aus Fig. 7 ersichtlich,
daß die Anzahl der Spektralkoeffizienten eines langen Blocks
gleich dem achtfachen der Anzahl der Spektralkoeffizienten
eines kurzen Blocks ist. Anders ausgedrückt umfaßt ein
langer Block dieselbe Zeitdauer des Audiosignals wie acht
kurze Blöcke.
Wie es in Fig. 2 gezigt ist, wird die Rückwärtstransfor
mationseinrichtung 502 über die Blocktypleitung 508 derart
gesteuert, daß sie acht zeitlich aufeinanderfolgende Rück
wärtstransformationen der Spektralkoeffizienten in entspre
chenden Subbändern von kurzen Blöcken durchführt und die
gewonnenen Quasi-Zeitsignale einfach seriell aneinander
reiht, um die Einrichtung 504 zur Erzeugung von Schätzwerten
mit einem Zeitsignal einer bestimmten Länge zu versorgen.
Analog dazu wird die Vorwärtstransformationseinrichtung 506
wieder acht aufeinanderfolgende Vorwärtstransformationen
durchführen, und zwar nacheinander mit den Werten, die von
der Einrichtung 504 zum Erzeugen von Schätzwerten seriell
ausgegeben werden. Somit bedingt dieser "Arbeitszyklus", daß
im Falle von kurzen Blöcken dieselbe Anzahl von Spektralko
effizienten ausgegeben wird, wie im Falle von langen
Blöcken. Die Spektralkoeffizienten, die durch die Fehlerver
schleierungseinrichtung 500 in einem "Arbeitszyklus" ausge
geben werden, werden im Sinne der vorliegenden Erfindung als
Satz von geschätzten Spektralkoeffizienten bezeichnet. Aus
Praktikabilitätsgründen entspricht die Anzahl der Spektral
koeffizienten in einem Satz der Anzahl der Spektralkoeffi
zienten in einem langen Block und der Anzahl der Spektralko
effizienten von acht kurzen Blöcken. Selbstverständlich
können beliebige andere Verhältnisse zwischen langem und
kurzem Block verwendet werden, beispielsweise 2, 4 oder 16.
Üblicherweise wird die Situation derart sein, daß die Anzahl
der Spektralkoeffizienten eines langen Blocks durch die
Anzahl der Spektralkoeffizienten eines kurzen Blocks teilbar
ist. Sollte dies jedoch aus irgendeinem Grunde nicht der
Fall sein, so würde die Anzahl eines Satzes von Spektral
koeffizienten dem kleinsten gemeinsamen Vielfachen von
langem und kurzem Block entsprechen, derart, daß Unab
hängigkeit vom Blocktyp auf Prädiktorebene, d. h. bei der
Einrichtung 504 zur Erzeugung von Schätzwerten, erreicht
wird.
In Fig. 3 ist eine bevorzugte Weiterbildung der Fehlerver
schleierungseinrichtung von Fig. 2 dargestellt. Die Fehler
verschleierungseinrichtung ist um eine Rauschersetzungsein
richtung 514 erweitert, die abhängig von einem Prädiktions
gewinnsignal 516 über einen Rauschersetzungsschalter 518 mit
der Fehler-Ersetzungs-Einrichtung gekoppelt werden kann. In
diesem Fall wird die Vorwärtstransformationseinrichtung 506
von der Fehler-Ersetzungs-Einrichtung abgeklemmt. Die
Rauschersetzungseinrichtung 514 arbeitet vorzugsweise nach
dem in der DE 197 35 675 A1 beschriebenen Verfahren, um
rauschhafte Signalanteile im Audiosignal anzunähern. Da es
sich um rauschhafte Spektralanteile handelt, wird nicht mehr
die Phase der Spektralkoeffizienten berücksichtigt, sondern
lediglich die Energie mehrerer Spektralkoeffizienten in ei
ner Untergruppe. Die Rauschersetzungseinrichtung 514 erzeugt
abhängig von der Energie in einer Untergruppe der zuletzt
vorhandenen intakten Audiodaten eine entsprechende Unter
gruppe von Spektralkoeffizienten, wobei die Energie in der
Untergruppe der erzeugten Spektralkoeffizienten der Energie
der entsprechenden Untergruppe der vorausgehenden Spektral
koeffizienten entspricht bzw. aus derselben abgeleitet ist.
Die Phasen der bei der Rauschersetzung erzeugten Spektralko
effizienten werden jedoch zufällig festgelegt.
Der Rauschersetzungsschalter 518 wird durch ein Prädiktions
gewinnsignal 516 gesteuert. Allgemein bezieht sich der Prä
diktionsgewinn auf das Verhältnis des Ausgangssignals der
Einrichtung 504 zur Erzeugung von Schätzwerten zum Eingangs
signal. Wird festgestellt, daß sich in einem Subband das
Ausgangssignal relativ wenig von dem Eingangssignal unter
scheidet, so kann davon ausgegangen werden, daß das Audio
signal in diesem Subband relativ stationär, d. h. tonal,
ist. Unterscheidet sich dagegen das Ausgangssignal des Prä
diktors sehr stark vom Eingangssignal, so kann davon ausge
gangen werden, daß das Signal instationär ist, d. h. atonal
oder rauschhaft. In diesem Fall wird eine Rauschersetzung
bessere Ergebnisse liefern als eine Prädiktion, da rausch
hafte Signale per se nicht zuverlässig vorhergesagt werden
können. So könnte beispielsweise der Rauschersetzungschalter
518 derart gesteuert werden, daß er die Vorwärtstransforma
tionseinrichtung 506 mit der Fehler-Ersetzungs-Einrichtung
512 verbindet, wenn der Prädiktionsgewinn eine bestimmte
Schwelle überschreitet, bzw. daß die Rauschersetzungsein
richtung 514 mit der Fehler-Ersetzung-Einrichtung 512 ver
bunden wird, wenn der Prädiktionsgewinn diese Schwelle un
terschreitet, um beide Substitutionsverfahren optimal zu
kombinieren.
Im Nachfolgenden wird bezugnehmend auf Fig. 4 auf das Ver
fahren der erfindungsgemäßen Rauschsubstitution näher einge
gangen. Zunächst wird ein aktueller Satz von Spektralkoeffi
zienten empfangen (10). Bei der Darstellung von Fig. 4 wird
aus Übersichtlichkeitsgründen davon ausgegangen, daß der ak
tuelle Satz von Spektralkoeffizienten ausschließlich intakte
Spektralkoeffizienten aufweist oder aber bereits einem Feh
lerverschleierungsverfahren nach Fig. 2 oder 3 unterzogen
worden ist. Der aktuelle Satz von Spektralkoeffizienten wird
einerseits von der Filterbank 400 (Fig. 1) verarbeitet und
beispielsweise an einen Lautsprecher ausgegeben (12). An
dererseits wird der aktuelle Satz von Spektralkoeffizienten
dazu verwendet, einen folgenden Satz von Spektralkoeffizien
ten vorherzusagen, d. h. zu schätzen bzw. zu prädizieren.
Dazu wird erfindungsgemäß eine Unterteilung des aktuellen
Satzes von Spektralkoeffizienten in Subbänder durchgeführt
(14). Im Falle eines langen Blockes findet die Unterteilung
in Subbänder derart statt, daß pro Satz lediglich ein Sub
band mit einem entsprechenden Frequenzbereich erzeugt wird.
Im Falle von kurzen Blöcken wird der aktuelle Satz von Spek
tralkoeffizienten eine Mehrzahl von zeitlich aufeinanderfol
genden kompletten Spektren umfassen. Dann werden im Schritt
14 für jedes vollständige Spektrum entsprechende Subbänder
erzeugt, d. h. pro Satz von Spektralkoeffizienten mehrere
Subbänder.
Nach der Unterteilung in Subbänder wird eine Rücktransforma
tion je Subband durchgeführt (16). Im Falle von langen Blöc
ken, d. h. die Anzahl der Spektralkoeffizienten eines Blocks
entspricht der Anzahl der Spektralkoeffizienten eines Sat
zes, wird eine einzige Rücktransformation pro Subband durch
geführt, bevor zur Prädiktion 18 übergegangen wird. Im Falle
von kurzen Blöcken werden mehrere Rücktransformationen ent
sprechend der Subbänder jedes "kurzen" Spektrums durchge
führt, bevor dann für sämtliche Subbänder zusammen eine Prä
diktion 18 durchgeführt wird.
Die Prädiktion 18 findet im Quasi-Zeitbereich statt, d. h.
für jedes Subband-"Zeit"-Signal, um ein geschätztes Subband-
Zeitsignal für den folgenden Satz zu erhalten. Dieses ge
schätzte Quasi-Zeitsignal wird anschließend wieder einer
Vorwärtstransformation 20 unterzogen, wobei die Vorwärts
transformation für einen langen Block wieder nur einmal
ausgeführt wird bzw. für kurze Blöcke N-mal, wobei N das
Verhältnis zwischen der Anzahl von Spektralkoeffizienten ei
nes langen Blocks zu der Anzahl von Spektralkoeffizienten
eines kurzen Blocks ist.
Nach dem Schritt 20 liegen für jedes Subband geschätzte
Spektralkoeffizienten vor. In einem Schritt 22 wird die in
dem Schritt 14 eingeführte Unterteilung wieder rückgängig
gemacht, derart, daß nach dem Schritt 22 ein folgender Satz
von Spektralkoeffizienten vorliegt.
In einem Schritt 24 wird von dem Decodierer der folgende
Satz von Spektralkoeffizienten empfangen. Dieser Satz wird
einer Fehlerdetektion 26 unterzogen, um festzustellen, ob
ein Spektralkoeffizient, mehrere Spektralkoeffizienten oder
sogar alle Spektralkoeffizienten des folgenden Satzes feh
lerhaft sind. Die Fehlerdetektion findet auf für Fachleute
bekannte Art und Weise statt, wobei beispielsweise die CRC-
Checksum (CRC = Cyclic Redundancy Code) über einem Frame
überprüft wird. Wird festgestellt, daß eine Checksum, die
aufgrund der übertragenen Daten berechnet wird, zu einer mit
den Daten übertragenen Checksum unterschiedlich ist, können
die geschätzten Spektralkoeffizienten, die durch den Schritt
22 erzeugt worden sind, statt der Spektralkoeffizienten des
fehlerhaften Blocks eingesetzt werden. Die fehlerhaften
Spektralkoeffizienten werden damit gegen die geschätzten
Spektralkoeffizienten ausgetauscht (28). Schließlich werden
die fehlerverschleierten Spektralkoeffizienten des folgenden
Satzes verarbeitet, um die zeitlichen Abtastwerte ausgeben
zu können (30).
Das Flußdiagramm von Fig. 4 stellt gewissermaßen eine Augen
blicksaufnahme der Verarbeitung von einem Satz von Spektral
koeffizienten zu einem nächsten Satz von Spektralkoeffizi
enten dar. Wird das Flußdiagramm von Fig. 4 implementiert,
so wird selbstverständlich beispielsweise nur eine einzige
Filterbank 400 (Fig. 1) verwendet, um die Schritte 12 und 30
durchzuführen. Genauso wird selbstverständlich nur eine
einzige Einrichtung zum Empfangen des aktuellen Satzes von
Spektralkoeffizienten bzw. zum Empfangen des folgenden
Satzes von Spektralkoeffizienten vonnöten sein, um die
Schritte 10 und 24 zu implementieren. Die zeitliche Synchro
nität für die Schritte 10 und 24 wird bei einer Vorrichtung,
die das erfindungsgemäße Verfahren implementiert, durch die
Zeitverzögerungsstufe 510 im Parallelzweig (Fig. 2) sicher
gestellt.
Fig. 5 zeigt eine detailliertere Darstellung des allgemeinen
Blockdiagramms von Fig. 2 am Beispiel eines MPEG-2 AAC-
Transformationscodierers, der die erfindungsgemäße Fehler
verschleierungseinrichtung 500 aufweist. Wie es bereits be
zugnehmend auf Fig. 2 dargestellt worden ist, umfaßt die
Fehlerverschleierungseinrichtung 500 (Fig. 1) eine Einrich
tung 520 zum Unterteilen der Blöcke von Spektralkoeffizien
ten in vorzugsweise 32 Subbänder. Im Falle von langen Blöc
ken hat jedes Subband 32 Spektralkoeffizienten. Da die Sub
bänder der kurzen Blöcke die gleichen Frequenzbereiche über
streichen, hat im Falle von kurzen Blöcken jedes Subband 4
Spektralkoeffizienten. Eine Aufteilung eines gesamten Spek
trums in gleichgroße Subbänder wird aus Gründen der Einfach
heit bevorzugt, wobei jedoch eine Unterteilung in ungleiche
Subbänder ebenfalls möglich wäre, beispielsweise angelehnt
an die psychoakustischen Frequenzgruppen. Jedes Subband wird
daraufhin einer inversen modifizierten diskreten Cosi
nus-Transformation unterzogen. Im Falle von langen Blöcken
läuft die IMDCT einmal ab und empfängt 32 Eingangswerte. Im
Falle von kurzen Blöcken werden acht aufeinanderfolgende
IMDCTs ausgeführt, und zwar jeweils mit 4 der Spektralko
effizienten, derart, daß sich am Ausgang wieder 32 Quasi-
Zeitabtastwerte ergeben. Diese werden dann dem Prädiktor 504
zugeführt, der wiederum 32 geschätzte Quasi-Zeitabtastwerte
erzeugt, die mittels der MDCT 506 transformiert werden. Im
Falle von langen Blöcken wird eine einzige MDCT mit 32
zeitlichen Werten durchgeführt, während im Falle von kurzen
Blöcken acht zeitlich aufeinanderfolgende MDCTs mit jeweils
4 Abtastwerten ausgeführt werden. Obwohl in Fig. 5 nur ein
Zweig für das nullte Subband dargestellt ist, sei
festgehalten, daß für jedes Subband ein identischer Zweig
existiert, wenn die Subbänder alle die gleiche Länge haben.
Haben die Subbänder unterschiedliche Längen, so sind die
Ordnungen der IMDCT bzw. der MDCT daran angepaßt. Für eine
praktische Implementation bietet sich eine parallele
Verarbeitung an. Selbstverständlich ist jedoch auch eine
serielle Verarbeitung der Subbänder hintereinander möglich,
wenn entsprechende Speicherkapazitäten vorgesehen werden.
Die Ausgangswerte der MDCT 506 für jedes Subband werden in
eine Einrichtung 522 zum Rückgängigmachen der Unterteilung,
d. h. in eine inverse Unterteilungseinrichtung, eingespeist,
um im Falle des bevorzugten Ausführungsbeispiels auf AAC-
MDCT-Ebene einen geschätzten Satz von Spektralwerten
auszugeben.
Fig. 6 zeigt eine weitere detaillierte Darstellung des Prä
diktors 504. Das Herzstück des Prädiktors 504 ist beim be
vorzugten Ausführungsbeispiel ein sogenannter LMSL-Prädiktor
504a, der eine Längen n = 32 hat. Details über den LMSL-Prä
diktor sind in dem Buch "Adaptive Signal Processing", Ber
nard Widrow, Samuel Stearns, Prentice-Hall, 1995, S. 99 ff.,
zu finden. Dem LMSL-Prädiktor 504a ist eine Zeitverzöge
rungsstufe 504b vorgeschaltet. Der Prädiktor 504 umfaßt
eingangsseitig ferner einen Parallel-Seriell-Wandler 504c
und ausgangseitig einen Seriell-Parallel-Wandler 504d.
Derselbe hat ferner eine Prädiktionsgewinnberechnungsein
richtung 504e, die das Ausgangssignal des Prädiktors 504a
mit dem Eingangssignal vergleicht, um feststellen zu können,
ob ein stationäres Signal oder ein instationäres Signal
verarbeitet worden ist. Die Prädiktionsgewinnberechnungsein
richtung 504e liefert ausgangsseitig das Prädiktionsgewinn
signal 516, das zur Steuerung des Schalters 518 (Fig. 3)
verwendet wird, um entweder prädizierte Spektralkoeffizien
ten oder durch Rauschersetzung gewonnene Spektralkoeffizien
ten zur Fehlerverschleierung zu verwenden. Der Prädiktor 504
umfaßt ferner in seiner Implemention als LMSL-Prädiktor zwei
Schalter 504f und 504g, die zwei Schalterstellungen haben.
Die Schalterstellung "1" betrifft den Fall, daß Spektralko
effizienten des folgenden Blocks fehlerfrei sind, während
die Schalterstellung "2" den Fall betrifft, daß Spektral
koeffizienten des folgenden Satzes fehlerhaft sind. In Fig.
6 ist der Fall gezeichnet, bei dem die Spektralkoeffizienten
fehlerhaft sind. In diesem Fall wird am Schalter 504g statt
des Eingangssignals ein Referenzsignal mit einem Wert von 0
in den Prädiktor eingespeist. Im Fall von fehlerfreien Spek
tralkoeffizienten (Schalterstellung "1" des Schalters 504g)
werden dagegen die Ausgangswerte des Parallel-Seriell-Wand
lers von unten in den LMSL-Prädiktor eingespeist.
Im Falle der Anwendung des erfindungsgemäßen Fehlerver
schleierungsverfahrens im Zusammenhang mit einem AAC-Codie
rer wird es bevorzugt, für sämtliche Vorwärts- bzw. Rück
wärtstransformationen die entsprechenden Transformationsal
gorithmen (MDCT bzw. IMDCT) zu verwenden. Für die Fehlerver
schleierung ist es jedoch nicht notwendig, daß zur Rück
wärts- bzw. zur Vorwärtstransformation dasselbe Transforma
tionsverfahren eingesetzt wird, das bei der Codierung des
Audiosignals verwendet wurde, um die Spektralkoeffizienten
zu bilden.
Aufgrund der Unterteilung des Spektrums in Subbänder und
aufgrund der einzelnen Transformationen für jedes Subband
werden für jedes Subband Frequenz-Zeitbereichs-Transforma
tionen mit niedrigerer Ordnung als der Frequenzauflösung
entsprechend verwendet. Somit werden spezielle Schätzwerte
für tonale Signalanteile in der Zwischenebene mittels des
Prädiktors erzeugt. Als Vorwärtstransformation/Synthese wer
den Zeit-Frequenzbereich-Transformationen niedrigerer Ord
nung als der ursprünglichen Frequenzauflösung entsprechend
verwendet, wobei die gleiche Ordnung gewählt wird wie bei
der benutzten Frequenz-Zeitbereichs-Transformation. Somit
liefert die erfindungsgemäße Fehlerverschleierung einerseits
Flexibilität unter Ausnutzung von Vorkenntnissen spektraler
Eigenschaften von Audiosignalen und andererseits eine Unab
hängigkeit von dem im Codierer verwendeten Transformations
verfahren durch Erzeugung der Schätzwerte im Quasi-Zeitsi
gnal, also nicht auf Spektralkoeffizientenebene. Wenn die
Prädiktion im Quasi-Zeitbereich zur Ersetzung tonaler Si
gnalanteile eingesetzt wird, und wenn die Rauschersetzung
für rauschhafte Spektralanteile verwendet wird, so können
Fehler für eine große Klasse von Audiosignalen selbst bei
vollständigem Blockverlust derart verschleiert werden, daß
nahezu keine hörbaren Störungen auftreten. Versuche haben
gezeigt, daß bei nicht allzu kritischen Testsignalen normale
Hörer, d. h. ungeschulte Testhörer, selbst bei vollständigem
Blockverlust nur in einem von 10 Fällen Unregelmäßigkeiten
im Audiosignal gehört haben.
Claims (13)
1. Verfahren zum Verschleiern eines Fehlers in einem co
dierten Audiosignal, wobei das codierte Audiosignal auf
einanderfolgende Sätze von Spektralkoeffizienten auf
weist, wobei ein Satz von Spektralkoeffizienten eine
spektrale Darstellung für einen Satz von Audioabtast
werten ist, mit folgenden Schritten:
Unterteilen (14) eines aktuellen Satzes von Spektral koeffizienten in mindestens zwei Subbänder mit unter schiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumindest zwei Spektralkoeffi zienten aufweist;
Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektralkoeffizienten des einen Subbandes zu erhalten;
Durchführen (18) einer Prädiktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralko effizienten des einen Subbandes, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den ak tuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbe reich wie das Subband des aktuellen Satzes umfaßt;
Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung um zumindest zwei geschätzte Spektralkoeffi zienten für das Subband des folgenden Satzes zu erhal ten;
Bestimmen (26) ob ein Spektralkoeffizient des Subbands des folgenden Satzes fehlerhaft ist; und
als Reaktion auf den Schritt des Bestimmens, falls ein fehlerhafter Spektralkoeffizient vorliegt, Verwenden (28) eines geschätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den fehlerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern.
Unterteilen (14) eines aktuellen Satzes von Spektral koeffizienten in mindestens zwei Subbänder mit unter schiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumindest zwei Spektralkoeffi zienten aufweist;
Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektralkoeffizienten des einen Subbandes zu erhalten;
Durchführen (18) einer Prädiktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralko effizienten des einen Subbandes, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den ak tuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbe reich wie das Subband des aktuellen Satzes umfaßt;
Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung um zumindest zwei geschätzte Spektralkoeffi zienten für das Subband des folgenden Satzes zu erhal ten;
Bestimmen (26) ob ein Spektralkoeffizient des Subbands des folgenden Satzes fehlerhaft ist; und
als Reaktion auf den Schritt des Bestimmens, falls ein fehlerhafter Spektralkoeffizient vorliegt, Verwenden (28) eines geschätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den fehlerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern.
2. Verfahren nach Anspruch 1, bei dem das eine Subband, das
im Schritt des Rückwärts-Transformierens (16) Verarbei
tet wird, niederfrequente Spektralkoeffizienten auf
weist, während das andere der mindestens zwei Subbänder
höherfrequente Spektralkoeffizienten aufweist.
3. Verfahren nach Anspruch 1 oder 2, bei dem die Anzahl der
Spektralkoeffizienten in einem Satz von Spektralkoeffi
zienten gleich der Anzahl von Spektralkoeffizienten in
einem Block (702) erster Länge und das N-fache der Spek
tralkoeffizienten in einem Block (704) zweiter Länge
ist, und bei dem N Blöcke (704) mit der zweiten Länge
hintereinander auftreten, wobei
der Schritt des Unterteilens (14) derart ausgeführt wird, daß die Subbänder der Blöcke mit der ersten Länge gleiche Frequenzbereiche umfassen, wie die Subbänder der Blöcke mit der zweiten Länge, derart, daß die Anzahl der Spektralkoeffizienten eines Subbandes des Blocks mit der ersten Länge gleich dem N-fachen der Anzahl der Spek tralkoeffizienten des entsprechenden Subbandes des Blocks mit der zweiten Länge ist;
der Schritt des Rückwärtstransformierens (16) für jedes entsprechende Subband der N Blöcke mit der zweiten Länge nacheinander ausgeführt wird, um eine zeitliche Darstel lung der Spektralkoeffizienten entsprechender Subbänder der N Blöcke mit der zweiten Länge zu erhalten;
der Schritt des Durchführens (18) einer Prädiktion mit der zeitlichen Darstellung sämtlicher entsprechender Subbänder der N Blöcke mit der zweiten Länge durchge führt wird; und
der Schritt des Vorwärtstransformierens (20) für jedes entsprechende Subband der N Blöcke mit der zweiten Länge nacheinander durchgeführt wird.
der Schritt des Unterteilens (14) derart ausgeführt wird, daß die Subbänder der Blöcke mit der ersten Länge gleiche Frequenzbereiche umfassen, wie die Subbänder der Blöcke mit der zweiten Länge, derart, daß die Anzahl der Spektralkoeffizienten eines Subbandes des Blocks mit der ersten Länge gleich dem N-fachen der Anzahl der Spek tralkoeffizienten des entsprechenden Subbandes des Blocks mit der zweiten Länge ist;
der Schritt des Rückwärtstransformierens (16) für jedes entsprechende Subband der N Blöcke mit der zweiten Länge nacheinander ausgeführt wird, um eine zeitliche Darstel lung der Spektralkoeffizienten entsprechender Subbänder der N Blöcke mit der zweiten Länge zu erhalten;
der Schritt des Durchführens (18) einer Prädiktion mit der zeitlichen Darstellung sämtlicher entsprechender Subbänder der N Blöcke mit der zweiten Länge durchge führt wird; und
der Schritt des Vorwärtstransformierens (20) für jedes entsprechende Subband der N Blöcke mit der zweiten Länge nacheinander durchgeführt wird.
4. Verfahren nach einem der vorhergehenden Ansprüche, bei
dem im Schritt des Unterteilens (14) eine Vielzahl von
Subbändern erzeugt wird, derart, daß alle Subbänder zu
sammen die spektrale Darstellung des codierten Audiosig
nals in einem Satz von Spektralkoeffizienten bilden.
5. Verfahren nach einem der vorhergehenden Ansprüche, bei
dem nach dem Schritt des Bestimmens (26), ob ein Spek
tralkoeffizient eines Subbands fehlerhaft ist, folgender
Schritt ausgeführt wird:
Bestimmen (504e), ob der Spektralkoeffizient einen to nalen Anteil des uncodierten Audiosignals darstellt, aufgrund eines Vergleichs des Spektralkoeffizienten mit dem entsprechenden geschätzten Spektralkoeffizienten;
falls der Spektralkoeffizient als tonal bestimmt wird, Verwenden des geschätzten Spektralkoeffizientens, und falls der Spektralkoeffizient als nicht-tonal bestimmt wird, Durchführen einer Rauschersetzung (514) für einen fehlerhaften Spektralkoeffizienten des folgenden Satzes.
Bestimmen (504e), ob der Spektralkoeffizient einen to nalen Anteil des uncodierten Audiosignals darstellt, aufgrund eines Vergleichs des Spektralkoeffizienten mit dem entsprechenden geschätzten Spektralkoeffizienten;
falls der Spektralkoeffizient als tonal bestimmt wird, Verwenden des geschätzten Spektralkoeffizientens, und falls der Spektralkoeffizient als nicht-tonal bestimmt wird, Durchführen einer Rauschersetzung (514) für einen fehlerhaften Spektralkoeffizienten des folgenden Satzes.
6. Verfahren nach einem der Ansprüche 3 bis 5, bei dem die
Spektralkoeffizienten MDCT-Koeffizienten sind, die Länge
eines Satzes der Länge eines langen Blocks entspricht
und 1024 MDCT-Koeffizienten beträgt, während ein Satz
von Spektralkoeffizienten acht Blöcke kurzer Länge um
faßt, von denen jeder 128 MDCT-Koeffizienten aufweist,
und bei dem im Schritt des Unterteilens 32 Subbänder je
32 MDCT-Koeffizienten für einen langen Block bzw. je 4
MDCT-Koeffizienten für einen kurzen Block gebildet
werden.
7. Verfahren nach einem der vorhergehenden Ansprüche, bei
dem im Schritt des Durchführens (18) der Prädiktion ein
adaptiver rückgekoppelter Prädiktor (504a) verwendet
wird, der vorzugsweise ein LMSL-Prädiktor ist.
8. Verfahren nach einem der vorhergehenden Ansprüche, bei
dem der Transformationsalgorithmus, der dem codierten
Audiosignal zugrunde liegt, der gleiche Transformations
algorithmus ist, der im Schritt des Rückwärts-Transfor
mierens (16) und im Schritt des Vorwärtstransformierens
(20) verwendet wird.
9. Verfahren nach einem der vorhergehenden Ansprüche, bei
dem der Transformationsalgorithmus, der im Schritt des
Rückwärts-Transformierens (16) verwendet wird, genau
invers zu dem Transformationsalgorithmus ist, der im
Schritt des Vorwärts-Transformierens (20) verwendet
wird.
10. Verfahren zum Decodieren eines codierten Audiosignals,
das aufeinanderfolgende Sätze von Spektralkoeffizienten
aufweist, wobei ein Satz von Spektralkoeffizienten eine
spektrale Darstellung für einen Satz von Audioabtastwer
ten ist:
Empfangen (10) eines aktuellen Satzes von Spektralko effizienten;
Unterteilen (14) eines aktuellen Satzes von Spektral koeffizienten in mindestens zwei Subbänder mit unter schiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumindest zwei Spektralko effizienten aufweist;
Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektralkoeffizienten des einen Subbandes zu erhalten;
Durchführen (18) einer Prädiktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralko effizienten des einen Subbandes, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den ak tuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbe reich wie das Subband des aktuellen Satzes umfaßt;
Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung um zumindest zwei geschätzte Spektralkoeffi zienten für das Subband des folgenden Satzes zu erhal ten;
Empfangen (24) eines folgenden Satzes von Spektralkoef fizienten und Unterteilen des folgenden Satzes in Sub bänder, die den gleichen Frequenzbereich wie die Subbän der des aktuellen Satzes umfassen;
Bestimmen (26) ob ein Spektralkoeffizient des Subbands des folgenden Satzes fehlerhaft ist;
als Reaktion auf den Schritt des Bestimmens, falls ein fehlerhafter Spektralkoeffizient vorliegt, Verwenden (28) eines geschätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den fehlerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern; und
Verarbeiten (30) des folgenden Satzes unter Benutzung des im Schritt des Verwendens (28) verwendeten geschätz ten Spektralkoeffizienten, um den folgenden Satz von Au dioabtastwerten zu erhalten.
Empfangen (10) eines aktuellen Satzes von Spektralko effizienten;
Unterteilen (14) eines aktuellen Satzes von Spektral koeffizienten in mindestens zwei Subbänder mit unter schiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumindest zwei Spektralko effizienten aufweist;
Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektralkoeffizienten des einen Subbandes zu erhalten;
Durchführen (18) einer Prädiktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralko effizienten des einen Subbandes, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den ak tuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbe reich wie das Subband des aktuellen Satzes umfaßt;
Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung um zumindest zwei geschätzte Spektralkoeffi zienten für das Subband des folgenden Satzes zu erhal ten;
Empfangen (24) eines folgenden Satzes von Spektralkoef fizienten und Unterteilen des folgenden Satzes in Sub bänder, die den gleichen Frequenzbereich wie die Subbän der des aktuellen Satzes umfassen;
Bestimmen (26) ob ein Spektralkoeffizient des Subbands des folgenden Satzes fehlerhaft ist;
als Reaktion auf den Schritt des Bestimmens, falls ein fehlerhafter Spektralkoeffizient vorliegt, Verwenden (28) eines geschätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den fehlerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern; und
Verarbeiten (30) des folgenden Satzes unter Benutzung des im Schritt des Verwendens (28) verwendeten geschätz ten Spektralkoeffizienten, um den folgenden Satz von Au dioabtastwerten zu erhalten.
11. Verfahren nach Anspruch 10, bei dem die Spektralkoeffi
zienten des codierten Audiosignals Entropie-codiert und
quantisiert sind, das vor dem Schritt des Empfangens
(10) des aktuellen Satzes bzw. des folgenden Satzes fol
gende Schritte aufweist:
Rückgängigmachen (200) der Entropie-Codierug um quanti sierte Spektralkoeffizienten zu erhalten;
Requantisieren (300) der quantisierten Spektralkoeffi zienten, um requantisierte Spektralkoeffizienten zu er halten;
und bei dem der Schritt des Verarbeitens folgenden Schritt aufweist:
Rücktransformieren (400) des folgenden Satzes unter Ver wendung eines Transformationsalgorithmus, der zu dem Transformationsalgorithmus invers ist, der zum Transfor mieren verwendet wurde, um die Spektralkoeffizienten des codierten Audiosignals zu erhalten.
Rückgängigmachen (200) der Entropie-Codierug um quanti sierte Spektralkoeffizienten zu erhalten;
Requantisieren (300) der quantisierten Spektralkoeffi zienten, um requantisierte Spektralkoeffizienten zu er halten;
und bei dem der Schritt des Verarbeitens folgenden Schritt aufweist:
Rücktransformieren (400) des folgenden Satzes unter Ver wendung eines Transformationsalgorithmus, der zu dem Transformationsalgorithmus invers ist, der zum Transfor mieren verwendet wurde, um die Spektralkoeffizienten des codierten Audiosignals zu erhalten.
12. Vorrichtung zum Verschleiern eines Fehlers in einem co
dierten Audiosignal, wobei das codierte Audiosignal auf
einanderfolgende Sätze von Spektralkoeffizienten auf
weist, wobei ein Satz von Spektralkoeffizienten eine
spektrale Darstellung für einen Satz von Audioabtast
werten ist, mit folgenden Merkmalen:
einer Einrichtung (520) zum Unterteilen (14) eines ak tuellen Satzes von Spektralkoeffizienten in mindestens zwei Subbänder mit unterschiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumin dest zwei Spektralkoeffizienten aufweist;
einer Einrichtung (502) zum Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektral koeffizienten des einen Subbandes zu erhalten;
einer Einrichtung (504) zum Durchführen (18) einer Prä diktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralkoeffizienten des einen Subban des, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den aktuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbereich wie das Subband des aktuellen Satzes umfaßt;
einer Einrichtung (506) zum Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung, um zumindest zwei geschätzte Spektralkoeffizienten für das Subband des folgenden Satzes zu erhalten;
einer Einrichtung zum Bestimmen (26) ob ein Spektralko effizient des Subbands des folgenden Satzes fehlerhaft ist; und
einer Einrichtung (512) zum Verwenden (28) eines ge schätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den feh lerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern.
einer Einrichtung (520) zum Unterteilen (14) eines ak tuellen Satzes von Spektralkoeffizienten in mindestens zwei Subbänder mit unterschiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumin dest zwei Spektralkoeffizienten aufweist;
einer Einrichtung (502) zum Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektral koeffizienten des einen Subbandes zu erhalten;
einer Einrichtung (504) zum Durchführen (18) einer Prä diktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralkoeffizienten des einen Subban des, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den aktuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbereich wie das Subband des aktuellen Satzes umfaßt;
einer Einrichtung (506) zum Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung, um zumindest zwei geschätzte Spektralkoeffizienten für das Subband des folgenden Satzes zu erhalten;
einer Einrichtung zum Bestimmen (26) ob ein Spektralko effizient des Subbands des folgenden Satzes fehlerhaft ist; und
einer Einrichtung (512) zum Verwenden (28) eines ge schätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den feh lerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern.
13. Vorrichtung zum Decodieren eines codierten Audiosignals,
das aufeinanderfolgende Sätze von Spektralkoeffizienten
aufweist, wobei ein Satz von Spektralkoeffizienten eine
spektrale Darstellung für einen Satz von Audioabtastwer
ten ist:
einer Einrichtung (100) zum Empfangen (10) eines aktu ellen Satzes von Spektralkoeffizienten;
einer Einrichtung (520) zum Unterteilen (14) eines aktu ellen Satzes von Spektralkoeffizienten in mindestens zwei Subbänder mit unterschiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumin dest zwei Spektralkoeffizienten aufweist;
einer Einrichtung (502) zum Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektral koeffizienten des einen Subbandes zu erhalten;
einer Einrichtung (504) zum Durchführen (18) einer Prä diktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralkoeffizienten des einen Subban des, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den aktuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbereich wie das Subband des aktuellen Satzes umfaßt;
einer Einrichtung (506) zum Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung um zumindest zwei geschätzte Spektralkoeffizienten für das Subband des folgenden Satzes zu erhalten;
einer Einrichtung (502, 510) zum Empfangen (24) eines folgenden Satzes von Spektralkoeffizienten und zum Unterteilen des folgenden Satzes in Subbänder, die den gleichen Frequenzbereich wie die Subbänder des aktuellen Satzes umfassen;
einer Einrichtung zum Bestimmen (26) ob ein Spektralko effizient des Subbands des folgenden Satzes fehlerhaft ist;
einer Einrichtung (512) zum Verwenden (28) eines ge schätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den feh lerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern; und
einer Einrichtung zum Verarbeiten (30) des folgenden Satzes unter Benutzung des geschätzten Spektralkoeffi zienten, um den folgenden Satz von Audioabtastwerten zu erhalten.
einer Einrichtung (100) zum Empfangen (10) eines aktu ellen Satzes von Spektralkoeffizienten;
einer Einrichtung (520) zum Unterteilen (14) eines aktu ellen Satzes von Spektralkoeffizienten in mindestens zwei Subbänder mit unterschiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumin dest zwei Spektralkoeffizienten aufweist;
einer Einrichtung (502) zum Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektral koeffizienten des einen Subbandes zu erhalten;
einer Einrichtung (504) zum Durchführen (18) einer Prä diktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralkoeffizienten des einen Subban des, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den aktuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbereich wie das Subband des aktuellen Satzes umfaßt;
einer Einrichtung (506) zum Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung um zumindest zwei geschätzte Spektralkoeffizienten für das Subband des folgenden Satzes zu erhalten;
einer Einrichtung (502, 510) zum Empfangen (24) eines folgenden Satzes von Spektralkoeffizienten und zum Unterteilen des folgenden Satzes in Subbänder, die den gleichen Frequenzbereich wie die Subbänder des aktuellen Satzes umfassen;
einer Einrichtung zum Bestimmen (26) ob ein Spektralko effizient des Subbands des folgenden Satzes fehlerhaft ist;
einer Einrichtung (512) zum Verwenden (28) eines ge schätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den feh lerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern; und
einer Einrichtung zum Verarbeiten (30) des folgenden Satzes unter Benutzung des geschätzten Spektralkoeffi zienten, um den folgenden Satz von Audioabtastwerten zu erhalten.
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19921122A DE19921122C1 (de) | 1999-05-07 | 1999-05-07 | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
PCT/EP2000/003294 WO2000068934A1 (de) | 1999-05-07 | 2000-04-12 | Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals |
JP2000617440A JP3623449B2 (ja) | 1999-05-07 | 2000-04-12 | 符号化されたオーディオ信号中のエラーを隠蔽する方法と装置および符号化されたオーディオ信号を復号化する方法と装置 |
AT00926896T ATE221244T1 (de) | 1999-05-07 | 2000-04-12 | Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals |
DE50000306T DE50000306D1 (de) | 1999-05-07 | 2000-04-12 | Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals |
EP00926896A EP1145227B1 (de) | 1999-05-07 | 2000-04-12 | Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals |
US09/980,534 US7003448B1 (en) | 1999-05-07 | 2000-04-12 | Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19921122A DE19921122C1 (de) | 1999-05-07 | 1999-05-07 | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19921122C1 true DE19921122C1 (de) | 2001-01-25 |
Family
ID=7907325
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19921122A Expired - Lifetime DE19921122C1 (de) | 1999-05-07 | 1999-05-07 | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
DE50000306T Expired - Lifetime DE50000306D1 (de) | 1999-05-07 | 2000-04-12 | Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE50000306T Expired - Lifetime DE50000306D1 (de) | 1999-05-07 | 2000-04-12 | Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals |
Country Status (6)
Country | Link |
---|---|
US (1) | US7003448B1 (de) |
EP (1) | EP1145227B1 (de) |
JP (1) | JP3623449B2 (de) |
AT (1) | ATE221244T1 (de) |
DE (2) | DE19921122C1 (de) |
WO (1) | WO2000068934A1 (de) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7315815B1 (en) * | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
DE19959038A1 (de) * | 1999-12-08 | 2001-06-28 | Bosch Gmbh Robert | Verfahren zur Dekodierung von digitalen Audiodaten |
EP1199709A1 (de) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Fehlerverdeckung in Bezug auf die Dekodierung von kodierten akustischen Signalen |
US7428684B2 (en) | 2002-04-29 | 2008-09-23 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Device and method for concealing an error |
DE10219133B4 (de) * | 2002-04-29 | 2007-02-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verschleiern eines Fehlers |
US7356748B2 (en) * | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
SE527669C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Förbättrad felmaskering i frekvensdomänen |
ATE523876T1 (de) * | 2004-03-05 | 2011-09-15 | Panasonic Corp | Fehlerverbergungseinrichtung und fehlerverbergungsverfahren |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
EP1793372B1 (de) * | 2004-10-26 | 2011-12-14 | Panasonic Corporation | Sprachkodierungsvorrichtung und sprachkodierungsverfahren |
KR100668319B1 (ko) * | 2004-12-07 | 2007-01-12 | 삼성전자주식회사 | 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치 |
KR100708123B1 (ko) * | 2005-02-04 | 2007-04-16 | 삼성전자주식회사 | 자동으로 오디오 볼륨을 조절하는 방법 및 장치 |
US7177804B2 (en) | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
JP2006276877A (ja) * | 2006-05-22 | 2006-10-12 | Nec Corp | 変換符号化されたデータの復号方法及び変換符号化されたデータの復号装置 |
KR101291193B1 (ko) | 2006-11-30 | 2013-07-31 | 삼성전자주식회사 | 프레임 오류은닉방법 |
DE602006015376D1 (de) * | 2006-12-07 | 2010-08-19 | Akg Acoustics Gmbh | Vorrichtung zur ausblendung von signalausfällen für eine mehrkanalanordnung |
US20090048828A1 (en) * | 2007-08-15 | 2009-02-19 | University Of Washington | Gap interpolation in acoustic signals using coherent demodulation |
US8126578B2 (en) * | 2007-09-26 | 2012-02-28 | University Of Washington | Clipped-waveform repair in acoustic signals using generalized linear prediction |
EP2242032B1 (de) * | 2008-01-21 | 2013-10-02 | Nippon Telegraph and Telephone Corporation | Sicheres datenverarbeitungssystem, sicheres datenverarbeitungsverfahren, sicheres datenverarbeitungsgerät und programm dafür |
WO2010111841A1 (zh) * | 2009-04-03 | 2010-10-07 | 华为技术有限公司 | 频域脉冲解码的预测方法和预测装置及解码器 |
JP2011257575A (ja) * | 2010-06-09 | 2011-12-22 | Cri Middleware Co Ltd | 音声処理装置、音声処理方法、プログラムおよび記録媒体 |
WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
EP2458585B1 (de) * | 2010-11-29 | 2013-07-17 | Nxp B.V. | Fehlerverdeckung für Subband-codierte Audiosignale |
AR085794A1 (es) | 2011-02-14 | 2013-10-30 | Fraunhofer Ges Forschung | Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral |
TR201903388T4 (tr) | 2011-02-14 | 2019-04-22 | Fraunhofer Ges Forschung | Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi. |
SG192746A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for processing a decoded audio signal in a spectral domain |
AU2012217158B2 (en) | 2011-02-14 | 2014-02-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
PL2661745T3 (pl) * | 2011-02-14 | 2015-09-30 | Fraunhofer Ges Forschung | Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio |
WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
TWI585747B (zh) * | 2011-10-21 | 2017-06-01 | 三星電子股份有限公司 | 訊框錯誤修補方法與裝置、音訊解碼方法與裝置 |
EP3576087B1 (de) | 2013-02-05 | 2021-04-07 | Telefonaktiebolaget LM Ericsson (publ) | Audiorahmenverlustüberbrückung |
BR112015031180B1 (pt) | 2013-06-21 | 2022-04-05 | Fraunhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Aparelho e método para gerar um formato espectral adaptativo de ruído de conforto |
KR101981548B1 (ko) | 2013-10-31 | 2019-05-23 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 도메인 여기 신호를 기초로 하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 |
EP3336840B1 (de) | 2013-10-31 | 2019-09-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiodecodierer und verfahren zur bereitstellung decodierter audioinformationen unter verwendung einer fehlerverdeckung zur modifizierung eines zeitbereichsanregungssignals |
CN112967727A (zh) * | 2014-12-09 | 2021-06-15 | 杜比国际公司 | Mdct域错误掩盖 |
US10763885B2 (en) | 2018-11-06 | 2020-09-01 | Stmicroelectronics S.R.L. | Method of error concealment, and associated device |
US10803876B2 (en) * | 2018-12-21 | 2020-10-13 | Microsoft Technology Licensing, Llc | Combined forward and backward extrapolation of lost network data |
US10784988B2 (en) | 2018-12-21 | 2020-09-22 | Microsoft Technology Licensing, Llc | Conditional forward error correction for network data |
CN111711493B (zh) * | 2020-06-16 | 2022-03-11 | 中国电子科技集团公司第三研究所 | 具有加密解密能力的水下通信设备及发射器和接收器 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4034017A1 (de) * | 1990-10-25 | 1992-04-30 | Fraunhofer Ges Forschung | Verfahren zum erkennen von fehlern bei der uebertragung von frequenzcodierten digitalen signalen |
DE19735675A1 (de) * | 1997-04-23 | 1998-12-03 | Fraunhofer Ges Forschung | Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5752225A (en) * | 1989-01-27 | 1998-05-12 | Dolby Laboratories Licensing Corporation | Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands |
JPH03245370A (ja) | 1990-02-22 | 1991-10-31 | Matsushita Electric Ind Co Ltd | 音声帯域分割復号化装置 |
JPH07123242B2 (ja) | 1993-07-06 | 1995-12-25 | 日本電気株式会社 | 音声信号復号化装置 |
KR970011728B1 (ko) | 1994-12-21 | 1997-07-14 | 김광호 | 음향신호의 에러은닉방법 및 그 장치 |
JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
EP1095370A1 (de) * | 1999-04-05 | 2001-05-02 | Hughes Electronics Corporation | Spektrale phasenmodellierung von prototyp-wellenformkomponenten für ein im frequenubereich arbeitendes interpolatives sprach-codec-system |
-
1999
- 1999-05-07 DE DE19921122A patent/DE19921122C1/de not_active Expired - Lifetime
-
2000
- 2000-04-12 AT AT00926896T patent/ATE221244T1/de active
- 2000-04-12 DE DE50000306T patent/DE50000306D1/de not_active Expired - Lifetime
- 2000-04-12 US US09/980,534 patent/US7003448B1/en not_active Expired - Lifetime
- 2000-04-12 EP EP00926896A patent/EP1145227B1/de not_active Expired - Lifetime
- 2000-04-12 WO PCT/EP2000/003294 patent/WO2000068934A1/de active IP Right Grant
- 2000-04-12 JP JP2000617440A patent/JP3623449B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4034017A1 (de) * | 1990-10-25 | 1992-04-30 | Fraunhofer Ges Forschung | Verfahren zum erkennen von fehlern bei der uebertragung von frequenzcodierten digitalen signalen |
DE19735675A1 (de) * | 1997-04-23 | 1998-12-03 | Fraunhofer Ges Forschung | Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom |
Non-Patent Citations (2)
Title |
---|
Herre, J.:"Fehlerverschleierung bei spektral codierten Audiosignalen", Dissertation, Techn. Fakultät der Universität Erlangen-Nürnberg, 1995 * |
Tribolet J.M., Crochiere R.E.:"Frequenzy Domain Coding of Speech", In: IEEE Trans. on Acoustics, Speech and Signal Processing, Vol. ASSP-27, No.5, Oct. 1979, S. 512-530 * |
Also Published As
Publication number | Publication date |
---|---|
JP3623449B2 (ja) | 2005-02-23 |
EP1145227A1 (de) | 2001-10-17 |
WO2000068934A1 (de) | 2000-11-16 |
ATE221244T1 (de) | 2002-08-15 |
US7003448B1 (en) | 2006-02-21 |
EP1145227B1 (de) | 2002-07-24 |
DE50000306D1 (de) | 2002-08-29 |
JP2002544550A (ja) | 2002-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19921122C1 (de) | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals | |
DE19747132C2 (de) | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms | |
EP0954909B1 (de) | Verfahren zum codieren eines audiosignals | |
DE60214027T2 (de) | Kodiervorrichtung und dekodiervorrichtung | |
DE602004005197T2 (de) | Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals | |
DE60117471T2 (de) | Breitband-signalübertragungssystem | |
DE69923555T2 (de) | Verfahren und vorrichtung zur entropie-kodierung von quantisierten transformationskoeffizienten eines signals | |
EP0978172B1 (de) | Verfahren zum verschleiern von fehlern in einem audiodatenstrom | |
WO1999004505A1 (de) | Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals | |
EP0251028B1 (de) | Verfahren zur Übertragung eines Audiosignales | |
DE102006051673A1 (de) | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale | |
EP1953739A2 (de) | Verfahren und Vorrichtung zur Geräuschunterdrückung | |
WO2001043503A2 (de) | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals | |
DE19743662A1 (de) | Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms | |
WO1991005411A1 (de) | Verfahren zur übertragung eines signals | |
DE102007029381A1 (de) | Digitalsignal-Verarbeitungsvorrichtung, Digitalsignal-Verarbeitungsverfahren, Digitalsignal-Verarbeitungsprogramm, Digitalsignal-Wiedergabevorrichtung und Digitalsignal-Wiedergabeverfahren | |
DE19742201C1 (de) | Verfahren und Vorrichtung zum Codieren von Audiosignalen | |
DE4209382C1 (de) | ||
DE19735675C2 (de) | Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom | |
DE10113322C2 (de) | Verfahren zur Codierung von Audiodaten | |
DE10119980C1 (de) | Verfahren zur Codierung von Audiodaten | |
WO2006072526A1 (de) | Verfahren zur bandbreitenerweiterung | |
DE10065363B4 (de) | Vorrichtung und Verfahren zum Decodieren eines codierten Datensignals | |
EP1458103B1 (de) | Verfahren und Vorrichtungen zum Codieren bzw. Decodieren eines Audiosignals bzw. eines Bitstroms | |
DE102005032079A1 (de) | Verfahren und Vorrichtung zur Geräuschunterdrückung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8100 | Publication of patent without earlier publication of application | ||
D1 | Grant (no unexamined application published) patent law 81 | ||
8364 | No opposition during term of opposition | ||
R071 | Expiry of right |