DE19921122C1

DE19921122C1 - Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals

Info

Publication number: DE19921122C1
Application number: DE19921122A
Authority: DE
Inventors: Pierre Lauber; Martin Dietz; Juergen Herre; Reinhold Boehm; Ralph Sperschneider; Daniel Homm
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 1999-05-07
Filing date: 1999-05-07
Publication date: 2001-01-25
Anticipated expiration: 2019-05-08
Also published as: JP3623449B2; EP1145227A1; WO2000068934A1; ATE221244T1; US7003448B1; EP1145227B1; DE50000306D1; JP2002544550A

Abstract

Bei einem Verfahren zum Verschleiern eines Fehlers in einem codierten Audiosignal wird ein Satz von Spektralkoeffizienten in mindestens zwei Subbändern unterteilt, woraufhin die Subbänder einer Rückwärtstransformation unterzogen werden. Für jedes Quasi-Zeitsignal eines Subbandes wird eine eigene Prädiktion durchgeführt, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den aktuellen Satz folgenden Satzes von Spektralkoeffizienten zu erhalten. Eine Vorwärtstransformation des Zeitsignals jedes Subbandes liefert geschätzte Spektralkoeffizienten, die anstatt fehlerhafter Spektralkoeffizienten eines folgenden Satzes von Spektralkoeffizienten verwendet werden können, um beispielsweise Übertragungsfehler zu verschleiern. Durch das subbandmäßige Transformieren wird einerseits Unabhängigkeit von Transformationseigenschaften, wie z. B. Blocklänge, Fenstertyp oder MDCT-Algorithmus, erreicht, während andererseits eine spektralmäßige Verarbeitung für die Fehlerverschleierung gewahrt bleibt. Damit können spektrale Eigenschaften von Audiosignalen auch bei der Fehlerverschleierung berücksichtigt werden.

Description

Die vorliegende Erfindung bezieht sich auf das Codieren bzw. Decodieren von Audiosignalen und insbesondere auf die Ver schleierung von Fehlern ("Error Concealment") in digital codierten Audiosignalen.

Mit zunehmender Verbreitung moderner Audiocodierer und ent sprechender Audiodecodierer, die nach einem der MPEG-Stan dards arbeiten, hat die Übertragung von codierten Audiosig nalen über Funknetze oder über leitungsgebundene Netze, wie z. B. das Internet, bereits eine große Bedeutung erlangt. Bei der Übertragung von codierten Audiosignalen mittels digitalem Rundfunk aber auch beim Übertragen von Audiosigna len über leitungsgebundene Netze liegt ein nicht-idealer Übertragungskanal vor, der dazu führen kann, daß codierte Audiosignale während der Übertragung gestört werden. Daher stellt sich decodiererseitig die Aufgabe, wie mit Übertra gungsfehlern umgegangen werden soll, bzw. wie Übertragungs fehler "verschleiert" werden sollen. Die Fehlerverschlei erung dient dazu, Übertragungsfehler auf irgendeine Art und Weise zu manipulieren, um den subjektiven Höreindruck eines solchen fehlerbehafteten decodierten Audiosignales zu ver bessern.

Mehrere Fehlerverschleierungsverfahren sind bereits bekannt. Die einfachste Art der Fehlerverschleierung besteht in dem Verfahren der Stummschaltung, das auch als "Muting" bezeich net wird. Erkennt ein Decodierer, daß Daten fehlen oder feh lerhaft sind, so schaltet derselbe die Wiedergabe ab. Die fehlenden Daten werden somit durch ein Null-Signal ersetzt. Damit wird vermieden, daß aufgrund eines Übertragungsfehlers zu laute bzw. unangenehme Geräusche eines Decodierers ausge geben werden. Aufgrund psychoakustischer Effekte wird dieses plötzliche Abfallen und Ansteigen der Signalenergie, wenn der Decodierer wieder fehlerfreie Daten ausgibt, dennoch als unangenehm empfunden.

Ein anderes bekanntes Verfahren, das den plötzlichen Abfall und Wiederanstieg der Signalenergie vermeidet, ist das Ver fahren der Datenwiederholung. Fällt beispielsweise ein Block oder mehrere Blöcke von Audiodaten aus, so wird ein Teil der zuletzt gesendeten Daten in einer Schleife wiederholt, bis wieder fehlerfreie, d. h. intakte Audiodaten vorliegen. Die ses Verfahren führt jedoch zu störenden Artefakten. Werden nur kurze Teile des Audiosignals wiederholt, so klingt das repetierte Signal unabhängig vom Orginalsignal maschinenar tig mit einer Grundfrequenz bei der Wiederholfrequenz. Wer den längere Teile wiederholt, entstehen bestimmte Echoeffek te, die ebenfalls als störend empfunden werden.

Bei blockorientierten Transformationscodierern/-decodierern, bei denen eine spektrale Darstellung eines zeitlichen Audio signals verwendet wird, würde ferner die Möglichkeit beste hen, eine spektralwertweise Prädiktion im Falle von fehler haften Audiodaten durchzuführen. Wird festgestellt, daß Spektralwerte in einem Block fehlerhaft sind, so können diese Spektralwerte basierend auf den Spektralwerten eines vorausgehenden Blocks oder mehrerer vorausgehender Blöcke prädiziert, d. h. vorhergesagt oder abgeschätzt werden. Die prädizierten Spektralwerte entsprechen in gewissen Grenzen den fehlerhaften Spektralwerten, wenn das Audiosignal rela tiv stationär ist, d. h. wenn das Audiosignal keinen so schnellen Änderungen der Signaleinhüllenden unterzogen ist. Wenn beispielsweise ein nach dem MPEG-AAC-Standard (ISO/IEC 13818-7 MPEG-2 Advanced Audio Coding) arbeitendes Verfahren betrachtet wird, so hat ein normaler Block von codierten Audiodaten 1024 Spektralwerte. Beim Verfahren der spek tralwertweisen Prädiktion werden daher 1024 parallel arbeitende Prädiktoren im Decodierer benötigt, um z. B. im Falle eines vollständigen Blockausfalls ("Frame Loss") sämtliche Spektralwerte prädizieren zu können.

Ein Nachteil dieses Verfahrens ist der relativ hohe Rechen aufwand, der derzeit eine Echtzeit Decodierung eines empfan genen Multimedia- oder Audiodatensignals unmöglich macht.

Ein weiterer wesentlicher Nachteil dieses Verfahrens wird durch den verwendeten Transformationsalgorithmus, die modi fizierte diskrete Cosinustransformation (MDCT), bedingt. Es ist allgemein bekannt, daß der MDCT-Algorithmus kein ideales Fourier-Spektrum liefert, sondern ein "Spektrum", das sich von einem idealen Fourier-Spektrum unterscheidet. Untersu chungen haben gezeigt, daß z. B. eine Sinus-Zeitfunktion, die ein Fourier-Spektrum aufweist, das eine einzige Spek trallinie bei der Frequenz der Sinusfunktion hat, ein MDCT- "Spektrum" hat, das zwar bei der Frequenz der Sinusfunktion einen dominierenden Spektralkoeffizienten hat, das jedoch zusätzlich weitere Spektralkoeffizienten bei anderen Fre quenzwerten aufweist. Außerdem ist die Höhe eines MDCT- "Spektrums" einer Sinusfunktion nicht von Block zu Block gleich, sondern dieselbe schwankt von Block zu Block. Eine weitere Tatsache ist, daß die MDCT-Transformation nicht streng energieerhaltend ist. So kann festgehalten werden, daß die MDCT-Transformation zwar zusammen mit einer inversen MDCT-Transformation exakt arbeitet, daß jedoch das MDCT- Spektrum wesentliche Unterschiede zu einem Fourier-Spektrum hat. Eine spektralwertweise Prädiktion von MDCT-Spektralko effizienten hat sich daher als unzureichend herausgestellt, wenn qualitativ hochwertige Anforderungen gestellt werden.

Ein weiterer Nachteil der spektralwertweisen Prädiktion ins besondere in Verbindung mit modernen Audiocodierverfahren besteht darin, daß moderne Audiocodierverfahren unterschied liche Fensterlängen bzw. Fensterformen verwenden. Um zu ver meiden, daß sich bei schnellen Änderungen des zu codierenden Audiosignals, d. h. bei Transienten oder Anschlägen, das durch die Quantisierung der MDCT-Spektralkoeffizienten ein geführte Quantisierungsrauschen über eine langen Block "ver schmiert", d. h. daß sogenannte Vorechos auftreten, verwen den moderne Transformationscodierer bei transienten Audio signalen, d. h. Audiosignalen mit Anschlägen, kurze Fenster, um die zeitliche Auflösung auf Kosten der Frequenzauflösung zu erhöhen. Dies führt aber dazu, daß bei einer spektral wertweisen Prädiktion ständig sowohl Fensterlänge als auch Fensterform (es existieren zudem Übergangsfenster, um eine Fensterung von kurzen zu langen Blöcken und umgekehrt ein zuleiten) berücksichtigt werden müssen, was ebenfalls zu einer Verkomplizierung der spektralwertweisen Prädiktion beiträgt und die Recheneffizienz empfindlich beeinflussen würde.

Die DE 40 34 017 A1 bezieht sich auf ein Verfahren zum Er kennen von Fehlern bei der Übertragung von frequenzcodierten digitalen Signalen. Hierbei wird aus Frequenzkoeffizienten zurückliegender sowie ggf. zukünftiger Blöcke eine Fehler funktion gebildet, anhand derer das Auftreten eines Fehlers ermittelt wird. Ein fehlerhafter Frequenzkoeffizient wird für die Bewertung nachfolgender Blöcke nicht mehr herange zogen.

Die DE 197 35 675 A1 offenbart ein Verfahren zum Verschlei ern von Fehlern in einem Audiodatenstrom. Hierzu wird die spektrale Energie einer Untergruppe von intakten Audiodaten berechnet. Nach dem Bilden einer Vorlage für Ersatzdaten aufgrund der für die Untergruppe der intakten Audiodaten be rechneten spektralen Energie werden Ersatzdaten für fehler hafte oder nicht vorhandene Audiodaten, die der Untergruppe entsprechen, aufgrund der Vorlage erzeugt.

Die Aufgabe der vorliegenden Erfindung besteht darin, eine präzise und flexible Fehlerverschleierung für Audiosignale zu schaffen, die mit begrenztem Rechenaufwand implementiert werden kann.

Diese Aufgabe wird durch ein Verfahren zum Verschleiern ein es Fehlers nach Patentanspruch 1 und eine Vorrichtung zum Verschleiern eines Fehlers nach Patentanspruch 12 gelöst.

Eine weitere Aufgabe der vorliegenden Erfindung besteht da rin, eine fehlerrobuste und flexible Decodierung von Audio signalen zu schaffen.

Diese Aufgabe wird durch ein Verfahren zum Decodieren eines codierten Audiosignals nach Patentanspruch 10 und durch eine Vorrichtung zum Decodieren eines codierten Audiosignals nach Patentanspruch 13 gelöst.

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß die Nachteile der spektralwertweisen Prädiktion, die in der Abhängigkeit von dem verwendeten Transformationsalgo rithmus und in der Abhängigkeit von Fensterform und Block länge bestehen, dadurch vermieden werden können, daß zur Fehlerverschleierung eine Prädiktion eingesetzt wird, die im "Quasi"-Zeitbereich arbeitet. Hierzu wird ein Satz von Spek tralwerten, der vorzugsweise einem langen Block bzw. einer Anzahl von kurzen Blöcken entspricht, in Subbänder unter teilt. Ein Subband des aktuellen Satzes von Spektralkoeffi zienten kann daraufhin einer Rückwärts-Transformation unter zogen werden, um ein Zeitsignal zu erhalten, das den Spek tralkoeffizienten des Subbandes entspricht. Zur Erzeugung von Schätzwerten für einen darauffolgenden Satz von Spek tralkoeffizienten wird eine Prädiktion auf der Basis des Zeitsignals dieses Subbandes durchgeführt.

Es sei darauf hingewiesen, daß diese Prädiktion im Quasi- Zeitbereich stattfindet, da das zeitliche Signal, auf der Basis dessen die Prädiktion durchgeführt wird, lediglich das Zeitsignal eines Subbandes des codierten Audiosignals und nicht das Zeitsignal des gesamten Spektrums des Audiosignals ist. Das mittels Prädiktion erzeugte Zeitsignal wird einer Vorwärtstransformation unterzogen, um geschätzte, d. h. prä dizierte Spektralkoeffizienten für das Subband des folgenden Satzes von Spektralkoeffizienten zu erhalten. Wird nun fest gestellt, daß in dem folgenden Satz von Spektralkoeffizien ten einer oder mehrere fehlerhafte Spektralkoeffizienten sind, so können die fehlerhaften Spektralkoeffizienten durch die geschätzten, d. h. prädizierten, Spektralkoeffizienten ersetzt werden.

Im Gegensatz zur reinen spektralwertweisen Prädiktion erfor dert das erfindungsgemäße Verfahren zum Verschleiern von Fehlern einen geringeren Rechenaufwand, da aufgrund der Gruppierung von Spektralkoeffizienten Prädiktionen nur noch für jedes Subband und nicht mehr für jeden Spektralkoeffizi enten durchgeführt werden müssen. Außerdem liefert das er findungsgemäße Verfahren eine hohe Flexibilität, da die Ei genschaften der zu verarbeitenden Signale berücksichtigt werden können.

Die Fehlerverschleierung gemäß der vorliegenden Erfindung arbeitet besonders gut für tonale Signale. Es wurde jedoch herausgefunden, daß tonale Signalanteile eher im niederfre quenteren Bereich des Spektrums eines Audiosignals auftre ten, während die höherfrequenten Signalanteile eher nicht stationär, d. h. rauschhaft, sind. "Rauschhafte Signalan teile" sind im Sinne der vorliegenden Beschreibung Signal anteile die wenig stationär sind. Diese rauschhaften Signal anteile müssen jedoch nicht unbedingt Rauschen im klassi schen Sinn darstellen, sondern lediglich sich schnell verän dernde Nutzsignale.

Zur weiteren Reduzierung des Rechenaufwands ermöglicht es die vorliegende Erfindung daher, lediglich niederfrequentere Signalanteile einer Prädiktion zu unterziehen, während hö herfrequentere Signalanteile überhaupt nicht verarbeitet werden. In anderen Worten ausgedrückt ist es möglich, nur das bzw. die unteren Subbänder einer Rückwärtstransforma tion, einer Prädiktion und einer Vorwärtstransformtion zu unterziehen.

Diese Eigenschaft der vorliegenden Erfindung stellt im Ver gleich zu einer vollständigen Transformation des gesamten Audiosignals in den Zeitbereich und einer Prädiktion des ge samten zeitlichen Audiosignals von Block zu Block unter Verwendung eines sogenannten "Long-Term"-Prädiktors einen wesentlichen Vorteil dar, da erfindungsgemäß die Vorteile der Prädiktion im Zeitbereich mit den Vorteilen der spek tralen Zerlegung kombiniert werden. Nur die spektrale Zer legung ermöglicht es, Eigenschaften des Audiosignals, die von der Frequenz abhängig sind, zu berücksichtigen. Die Anzahl der Subbänder, die beim Unterteilen des Satzes von Spektralkoeffizienten erzeugt wird, ist beliebig wählbar. Werden nur zwei Subbänder gewählt, so ergibt sich bereits der Vorteil der Berücksichtigung der Tonalität im unteren Frequenzbereich des Audiosignals. Werden dagegen sehr viele Subbänder gewählt, so wird der Prädiktor im Quasi-Zeitbe reich eine relativ kurze Länge haben, derart, daß seine Verzögerung nicht allzu groß wird. Da die einzelnen Sub bänder vorzugsweise parallel verarbeitet werden, wären bei einer Ausführung der vorliegenden Erfindung unter Verwendung eines festverdrahteten integrierten Schaltkreises viele parallele Prädiktorschaltungen notwendig.

Wird die vorliegende Erfindung im Zusammenhang mit einem Transformationscodierer eingesetzt, der unterschiedliche Blocklängen verwendet, so ergibt sich der Vorteil, daß der Prädiktor selbst von Blocklänge ("Block Length") und Fen sterform ("Window Shape") unabhängig ist. Außerdem wird durch die Rücktransformation die Abhängigkeit von dem verwendeten Transformationsalgorithmus selbst, die oben bezüglich der MDCT ausgeführt worden ist, eliminiert. Wei terhin liefert das erfindungsgemäße Konzept zur Fehlerver schleierung geschätzte Spektralkoeffizienten, die aufgrund der Rückwärtstransformation, der Prädiktion im Zeitbereich und der Vorwärtstransformation phasenrichtig sind, d. h. es treten keine Phasensprünge im Zeitsignal aufgrund eines prädizierten Spektralkoeffizienten gegenüber einem Zeitsi gnal eines vorausgehenden intakten Satzes von Spektral koeffizienten auf. Damit können tonale Signale derart gut für fehlerhafte oder fehlende Signalanteile substituiert werden, daß ein üblicher Hörer in den allermeisten Fällen nicht einmal merkt, daß ein Fehler aufgetreten ist.

Schließlich eignet sich das erfindungsgemäße Verfahren be sonders gut für eine Kombination mit einer Fehlerverschlei erungstechnik, die in der DE 197 35 675 A1 beschrieben ist, die für die Substitution von rauschhaften Signalanteilen geeignet ist. Werden tonale Signalanteile eines fehlenden Blocks durch das erfindungsgemäße Verfahren verschleiert, und werden rauschhafte Signalanteile durch das eben erwähnte bekannte Verfahren, daß auf einer Energieähnlichkeit zwi schen substituierten Daten und intakten Daten aufbaut, kom biniert, so können vollständig ausgefallene Blöcke nahezu unhörbar für einen normalen Hörer verschleiert werden.

Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Zeich nungen detailliert erläutert. Es zeigen:

Fig. 1 einen Decodierer, der eine erfindungsgemäße Fehler verschleierungseinrichtung aufweist;

Fig. 2 ein detaillierteres Blockschaltbild der Fehlerver schleierungseinrichtung von Fig. 1;

Fig. 3 ein detaillierteres Blockschaltbild der Fehlerver schleierungseinrichtung von Fig. 1, die zudem eine Rauschersetzung aufweist und basierend auf dem Prädiktionsgewinn arbeitet;

Fig. 4 ein Flußdiagramm für das erfindungsgemäße Verfahren zur Fehlerverschleierung;

Fig. 5 ein detailliertes Blockschaltbild eines bevorzugten Ausführungsbeispiels der Fehlerverschleierungsein richtung für einen MPEG-2 AAC-Decodierer;

Fig. 6 ein detailliertes Blockschaltbild des Prädiktors von Fig. 5; und

Fig. 7 eine schematische Darstellung der Blockstruktur nach dem AAC-Standard.

Fig. 1 zeigt ein Blockschaltbild eines Decodierers gemäß ei nem bevorzugten Ausführungsbeispiel der vorliegenden Erfin dung. Das in Fig. 1 gezeigte Decodiererblockschaltbild ent spricht grundsätzlich dem MPEG-2 AAC-Decodierer, wie er im Standard MPEG-2 AAC 13818-7 festgelegt ist. Das codierte Au diosignal gelangt zunächst in einen Bitstrom-Demultiplexer 100, um Spektraldaten und Seiteninformationen zu trennen. Die Huffman-codierten Spektralkoeffizienten werden dann in einen Huffman-Decodierer 200 eingespeist, um aus den Huff man-Codewörtern quantisierte Spektralwerte zu erhalten. Die quantisierten Spektralwerte werden anschließend in einen in versen Quantisierer 300 eingespeist und anschließend skalen faktorbandweise mit entsprechenden Skalenfaktoren multipli ziert. Der erfindungsgemäße Codierer kann im Anschluß an den inversen Quantisierer 300 mehrere weitere Funktionalitäten haben, wie z. B. eine Mitte/Seite-Stufe, eine Prädiktor-Stu fe, eine TNS-Stufe usw. wie es im Standard festgelegt ist.

Gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung umfaßt der Decodierer unmittelbar vor einer Syn these-Filterbank 400 eine Fehlerverschleierungseinrichtung 500, die erfindungsgemäß arbeitet und dafür sorgt, daß die Auswirkungen von Übertragungsfehlern in dem codierten Audio signal, das in den Bitstrom-Demultiplexer 100 eingespeist wird, gelindert bzw. vollständig unhörbar gemacht werden können. Anders ausgedrückt bewirkt die Fehlerverschleier ungseinrichtung 500, daß Übertragungsfehler verschleiert werden, d. h. daß sie in einem zeitlichen Audiosignal am Ausgang der Synthese-Filterbank nicht oder nur noch schwach hörbar sind.

Fig. 2 zeigt ein allgemeines Blockschaltbild der Fehlerver schleierungseinrichtung 500. Dieselbe umfaßt eine Rückwärts transformationseinrichtung 502, eine Einrichtung 504 zur Er zeugung von Schätzwerten sowie eine Einrichtung 506 zur Vor wärtstransformation. Sowohl die Rückwärtstransformationsein richtung 502 als auch die Vorwärtstransformationseinrichtung 506 sind abhängig von dem Blocktyp, der gerade vorliegt, über eine Blocktypleitung 508 steuerbar. Die Fehlerver schlüsselungseinrichtung 500 umfaßt ferner einen Parallel zweig, um die eingangsseitigen Spektralkoeffizienten unter Umgehung der Rückwärtstransformationseinrichtung 502, der Einrichtung zur Erzeugung von Schätzwerten 504 und der Vor wärtstransformationseinrichtung 506 direkt vom Eingang zum Ausgang zu leiten. Dieser Parallelzweig umfaßt eine Zeitverzögerungsstufe 510, um sicherzustellen, daß hinter der Vorwärtstransformationseinrichtung 506 vorliegende geschätzte Spektralkoeffizienten für einen folgenden Block gleichzeitig mit "realen", unter Umständen fehlerhaften Spektralkoeffizienten für den folgenden Block an einer Fehler-Auswahl-Einrichtung 512 anliegen, um eventuell fehlerhafte Spektralkoeffizienten in den realen Spektralko effizienten für den folgenden Block durch geschätzte Spek tralkoeffizienten für den folgenden Block ersetzen zu kön nen. Diese spektralwertweise Ersetzung ist durch ein Schaltersymbol 512 in Fig. 2 dargestellt. Es sei darauf hingewiesen, daß die Fehler-Ersetzungs-Einrichtung 512 entweder spektralwertweise oder block- bzw. satzweise arbeiten kann. Je nach Anforderung kann dieselbe auch subbandweise arbeiten. Am Ausgang der Fehler-Ersetzungs-Ein richtung 512 liegt dann der folgende Satz von Spektral koeffizienten vor, in dem eventuell ursprünglich fehlerhafte Spektralkoeffizienten durch geschätzte Spektralkoeffizienten ersetzt worden sind, d. h. in dem Fehler verschleiert sind.

An dieser Stelle sei darauf hingewiesen, daß das Block schaltbild, das in Fig. 2 gezeigt ist, lediglich einen Teil der Fehlerverschleierungseinrichtung 500 darstellt. Diese Darstellung wurde jedoch aus Übersichtlichkeitsgründen ge wählt. Wie es in Fig. 5 anhand eines bevorzugten Ausführ ungsbeispiels der vorliegenden Erfindung näher erläutert werden wird, ist der in Fig. 2 gezeigten Schaltung eine Ein richtung zur Unterteilung in Subbänder vorgeschaltet. Analog dazu ist der Fehler-Ersetzungs-Einrichtung 512 eine Einrich tung zum Rückgängigmachen der Unterteilung in Subbänder nachgeschaltet, derart, daß die Filterbank 400 (Fig. 1) ei nen "normalen" Satz von Spektralkoeffizienten erhält, ohne von der vorausgegangenen Fehlerverschleierung irgendetwas zu merken. Die Fehlerverschleierungseinrichtung 500 (Fig. 1) umfaßt somit eine Mehrzahl von bezugnehmend auf Fig. 2 be schriebenen Schaltungen, und zwar eine Schaltung für jedes Subband. Die parallelen Schaltungen sind eingangsseitig durch die Einrichtung zum Unterteilen verbunden und aus gangsseitig durch die Einrichtung zum Rückgängigmachen der Unterteilung, wie es später detailliert ausgeführt wird.

Es wurde bereits früher darauf hingewiesen, daß moderne Transformationscodierer zur Erhöhung der zeitlichen Auflö sung im Falle von Transienten in einem zu codierenden Au diosignal kurze Fenster verwenden. Dabei ist es gebräuch lich, daß die Anzahl der zeitlichen Abtastwerte bzw. die An zahl der Spektralkoeffizienten in einem langen Fenster bzw. Block ein ganzzahliges Vielfaches der Anzahl von zeitlichen Abtastwerten bzw. Spektralkoeffizienten in einem kurzen Fen ster bzw. Block darstellt. Ein vorteilhafter Effekt der vor liegenden Erfindung besteht darin, daß die Einrichtung 504 zur Erzeugung von Schätzwerten unabhängig von der verwen deten Transformation, von der verwendeten Blocklänge bzw. von dem verwendeten Fenstertyp arbeiten kann. Daher werden sowohl die Rückwärtstransformationseinrichtung 502 als auch die Vorwärtstransformationseinrichtung 506 Blocktyp-abhängig gesteuert, um der Einrichtung 504 zur Erzeugung von Schätz werten immer dieselbe Anzahl von zeitlichen Abtastwerten zu zuführen bzw. von derselben abzuführen.

Zur weiteren Veranschaulichung dieser Eigenschaft wird nach folgend auf Fig. 7 Bezug genommen, um die Situation für MPEG-2 AAC darzustellen. Fig. 7 umfaßt eine Zeitachse 700, bezüglich der die Ausdehnung eines langen Blocks 702 darge stellt ist. Ein langer Block umfaßt 2048 Abtastwerte, woraus sich 1024 Spektralkoeffizienten ergeben, wenn eine 50%-ige Überlappung der Fenster eingesetzt wird, wie es bekannt ist. Hintergründe zur verwendeten modifizierten diskreten Cosi nus-Transformation (MDCT) und der Fensterüberlappung finden sich in dem bereits zitierten Standard. In Fig. 7 sind fer ner acht kurze Blöcke 704 eingezeichnet, von denen jeder 256 Abtastwerte aufweist, um wieder aufgrund der 50%-igen Über lappung 128 Spektralkoeffizienten zu ergeben. Aus Übersicht lichkeitsgründen wurde in Fig. 7 die Überlappung der kurzen Blöcke sowie die Überlappung des langen Blocks mit einem vorausgehenden langen Block bzw. mit einem vorausgehenden oder einem nachgeschalteten Start- bzw. Stoppfenster nicht eingezeichnet. Auf jeden Fall ist aus Fig. 7 ersichtlich, daß die Anzahl der Spektralkoeffizienten eines langen Blocks gleich dem achtfachen der Anzahl der Spektralkoeffizienten eines kurzen Blocks ist. Anders ausgedrückt umfaßt ein langer Block dieselbe Zeitdauer des Audiosignals wie acht kurze Blöcke.

Wie es in Fig. 2 gezigt ist, wird die Rückwärtstransfor mationseinrichtung 502 über die Blocktypleitung 508 derart gesteuert, daß sie acht zeitlich aufeinanderfolgende Rück wärtstransformationen der Spektralkoeffizienten in entspre chenden Subbändern von kurzen Blöcken durchführt und die gewonnenen Quasi-Zeitsignale einfach seriell aneinander reiht, um die Einrichtung 504 zur Erzeugung von Schätzwerten mit einem Zeitsignal einer bestimmten Länge zu versorgen. Analog dazu wird die Vorwärtstransformationseinrichtung 506 wieder acht aufeinanderfolgende Vorwärtstransformationen durchführen, und zwar nacheinander mit den Werten, die von der Einrichtung 504 zum Erzeugen von Schätzwerten seriell ausgegeben werden. Somit bedingt dieser "Arbeitszyklus", daß im Falle von kurzen Blöcken dieselbe Anzahl von Spektralko effizienten ausgegeben wird, wie im Falle von langen Blöcken. Die Spektralkoeffizienten, die durch die Fehlerver schleierungseinrichtung 500 in einem "Arbeitszyklus" ausge geben werden, werden im Sinne der vorliegenden Erfindung als Satz von geschätzten Spektralkoeffizienten bezeichnet. Aus Praktikabilitätsgründen entspricht die Anzahl der Spektral koeffizienten in einem Satz der Anzahl der Spektralkoeffi zienten in einem langen Block und der Anzahl der Spektralko effizienten von acht kurzen Blöcken. Selbstverständlich können beliebige andere Verhältnisse zwischen langem und kurzem Block verwendet werden, beispielsweise 2, 4 oder 16. Üblicherweise wird die Situation derart sein, daß die Anzahl der Spektralkoeffizienten eines langen Blocks durch die Anzahl der Spektralkoeffizienten eines kurzen Blocks teilbar ist. Sollte dies jedoch aus irgendeinem Grunde nicht der Fall sein, so würde die Anzahl eines Satzes von Spektral koeffizienten dem kleinsten gemeinsamen Vielfachen von langem und kurzem Block entsprechen, derart, daß Unab hängigkeit vom Blocktyp auf Prädiktorebene, d. h. bei der Einrichtung 504 zur Erzeugung von Schätzwerten, erreicht wird.

In Fig. 3 ist eine bevorzugte Weiterbildung der Fehlerver schleierungseinrichtung von Fig. 2 dargestellt. Die Fehler verschleierungseinrichtung ist um eine Rauschersetzungsein richtung 514 erweitert, die abhängig von einem Prädiktions gewinnsignal 516 über einen Rauschersetzungsschalter 518 mit der Fehler-Ersetzungs-Einrichtung gekoppelt werden kann. In diesem Fall wird die Vorwärtstransformationseinrichtung 506 von der Fehler-Ersetzungs-Einrichtung abgeklemmt. Die Rauschersetzungseinrichtung 514 arbeitet vorzugsweise nach dem in der DE 197 35 675 A1 beschriebenen Verfahren, um rauschhafte Signalanteile im Audiosignal anzunähern. Da es sich um rauschhafte Spektralanteile handelt, wird nicht mehr die Phase der Spektralkoeffizienten berücksichtigt, sondern lediglich die Energie mehrerer Spektralkoeffizienten in ei ner Untergruppe. Die Rauschersetzungseinrichtung 514 erzeugt abhängig von der Energie in einer Untergruppe der zuletzt vorhandenen intakten Audiodaten eine entsprechende Unter gruppe von Spektralkoeffizienten, wobei die Energie in der Untergruppe der erzeugten Spektralkoeffizienten der Energie der entsprechenden Untergruppe der vorausgehenden Spektral koeffizienten entspricht bzw. aus derselben abgeleitet ist. Die Phasen der bei der Rauschersetzung erzeugten Spektralko effizienten werden jedoch zufällig festgelegt.

Der Rauschersetzungsschalter 518 wird durch ein Prädiktions gewinnsignal 516 gesteuert. Allgemein bezieht sich der Prä diktionsgewinn auf das Verhältnis des Ausgangssignals der Einrichtung 504 zur Erzeugung von Schätzwerten zum Eingangs signal. Wird festgestellt, daß sich in einem Subband das Ausgangssignal relativ wenig von dem Eingangssignal unter scheidet, so kann davon ausgegangen werden, daß das Audio signal in diesem Subband relativ stationär, d. h. tonal, ist. Unterscheidet sich dagegen das Ausgangssignal des Prä diktors sehr stark vom Eingangssignal, so kann davon ausge gangen werden, daß das Signal instationär ist, d. h. atonal oder rauschhaft. In diesem Fall wird eine Rauschersetzung bessere Ergebnisse liefern als eine Prädiktion, da rausch hafte Signale per se nicht zuverlässig vorhergesagt werden können. So könnte beispielsweise der Rauschersetzungschalter 518 derart gesteuert werden, daß er die Vorwärtstransforma tionseinrichtung 506 mit der Fehler-Ersetzungs-Einrichtung 512 verbindet, wenn der Prädiktionsgewinn eine bestimmte Schwelle überschreitet, bzw. daß die Rauschersetzungsein richtung 514 mit der Fehler-Ersetzung-Einrichtung 512 ver bunden wird, wenn der Prädiktionsgewinn diese Schwelle un terschreitet, um beide Substitutionsverfahren optimal zu kombinieren.

Im Nachfolgenden wird bezugnehmend auf Fig. 4 auf das Ver fahren der erfindungsgemäßen Rauschsubstitution näher einge gangen. Zunächst wird ein aktueller Satz von Spektralkoeffi zienten empfangen (10). Bei der Darstellung von Fig. 4 wird aus Übersichtlichkeitsgründen davon ausgegangen, daß der ak tuelle Satz von Spektralkoeffizienten ausschließlich intakte Spektralkoeffizienten aufweist oder aber bereits einem Feh lerverschleierungsverfahren nach Fig. 2 oder 3 unterzogen worden ist. Der aktuelle Satz von Spektralkoeffizienten wird einerseits von der Filterbank 400 (Fig. 1) verarbeitet und beispielsweise an einen Lautsprecher ausgegeben (12). An dererseits wird der aktuelle Satz von Spektralkoeffizienten dazu verwendet, einen folgenden Satz von Spektralkoeffizien ten vorherzusagen, d. h. zu schätzen bzw. zu prädizieren. Dazu wird erfindungsgemäß eine Unterteilung des aktuellen Satzes von Spektralkoeffizienten in Subbänder durchgeführt (14). Im Falle eines langen Blockes findet die Unterteilung in Subbänder derart statt, daß pro Satz lediglich ein Sub band mit einem entsprechenden Frequenzbereich erzeugt wird. Im Falle von kurzen Blöcken wird der aktuelle Satz von Spek tralkoeffizienten eine Mehrzahl von zeitlich aufeinanderfol genden kompletten Spektren umfassen. Dann werden im Schritt 14 für jedes vollständige Spektrum entsprechende Subbänder erzeugt, d. h. pro Satz von Spektralkoeffizienten mehrere Subbänder.

Nach der Unterteilung in Subbänder wird eine Rücktransforma tion je Subband durchgeführt (16). Im Falle von langen Blöc ken, d. h. die Anzahl der Spektralkoeffizienten eines Blocks entspricht der Anzahl der Spektralkoeffizienten eines Sat zes, wird eine einzige Rücktransformation pro Subband durch geführt, bevor zur Prädiktion 18 übergegangen wird. Im Falle von kurzen Blöcken werden mehrere Rücktransformationen ent sprechend der Subbänder jedes "kurzen" Spektrums durchge führt, bevor dann für sämtliche Subbänder zusammen eine Prä diktion 18 durchgeführt wird.

Die Prädiktion 18 findet im Quasi-Zeitbereich statt, d. h. für jedes Subband-"Zeit"-Signal, um ein geschätztes Subband- Zeitsignal für den folgenden Satz zu erhalten. Dieses ge schätzte Quasi-Zeitsignal wird anschließend wieder einer Vorwärtstransformation 20 unterzogen, wobei die Vorwärts transformation für einen langen Block wieder nur einmal ausgeführt wird bzw. für kurze Blöcke N-mal, wobei N das Verhältnis zwischen der Anzahl von Spektralkoeffizienten ei nes langen Blocks zu der Anzahl von Spektralkoeffizienten eines kurzen Blocks ist.

Nach dem Schritt 20 liegen für jedes Subband geschätzte Spektralkoeffizienten vor. In einem Schritt 22 wird die in dem Schritt 14 eingeführte Unterteilung wieder rückgängig gemacht, derart, daß nach dem Schritt 22 ein folgender Satz von Spektralkoeffizienten vorliegt.

In einem Schritt 24 wird von dem Decodierer der folgende Satz von Spektralkoeffizienten empfangen. Dieser Satz wird einer Fehlerdetektion 26 unterzogen, um festzustellen, ob ein Spektralkoeffizient, mehrere Spektralkoeffizienten oder sogar alle Spektralkoeffizienten des folgenden Satzes feh lerhaft sind. Die Fehlerdetektion findet auf für Fachleute bekannte Art und Weise statt, wobei beispielsweise die CRC- Checksum (CRC = Cyclic Redundancy Code) über einem Frame überprüft wird. Wird festgestellt, daß eine Checksum, die aufgrund der übertragenen Daten berechnet wird, zu einer mit den Daten übertragenen Checksum unterschiedlich ist, können die geschätzten Spektralkoeffizienten, die durch den Schritt 22 erzeugt worden sind, statt der Spektralkoeffizienten des fehlerhaften Blocks eingesetzt werden. Die fehlerhaften Spektralkoeffizienten werden damit gegen die geschätzten Spektralkoeffizienten ausgetauscht (28). Schließlich werden die fehlerverschleierten Spektralkoeffizienten des folgenden Satzes verarbeitet, um die zeitlichen Abtastwerte ausgeben zu können (30).

Das Flußdiagramm von Fig. 4 stellt gewissermaßen eine Augen blicksaufnahme der Verarbeitung von einem Satz von Spektral koeffizienten zu einem nächsten Satz von Spektralkoeffizi enten dar. Wird das Flußdiagramm von Fig. 4 implementiert, so wird selbstverständlich beispielsweise nur eine einzige Filterbank 400 (Fig. 1) verwendet, um die Schritte 12 und 30 durchzuführen. Genauso wird selbstverständlich nur eine einzige Einrichtung zum Empfangen des aktuellen Satzes von Spektralkoeffizienten bzw. zum Empfangen des folgenden Satzes von Spektralkoeffizienten vonnöten sein, um die Schritte 10 und 24 zu implementieren. Die zeitliche Synchro nität für die Schritte 10 und 24 wird bei einer Vorrichtung, die das erfindungsgemäße Verfahren implementiert, durch die Zeitverzögerungsstufe 510 im Parallelzweig (Fig. 2) sicher gestellt.

Fig. 5 zeigt eine detailliertere Darstellung des allgemeinen Blockdiagramms von Fig. 2 am Beispiel eines MPEG-2 AAC- Transformationscodierers, der die erfindungsgemäße Fehler verschleierungseinrichtung 500 aufweist. Wie es bereits be zugnehmend auf Fig. 2 dargestellt worden ist, umfaßt die Fehlerverschleierungseinrichtung 500 (Fig. 1) eine Einrich tung 520 zum Unterteilen der Blöcke von Spektralkoeffizien ten in vorzugsweise 32 Subbänder. Im Falle von langen Blöc ken hat jedes Subband 32 Spektralkoeffizienten. Da die Sub bänder der kurzen Blöcke die gleichen Frequenzbereiche über streichen, hat im Falle von kurzen Blöcken jedes Subband 4 Spektralkoeffizienten. Eine Aufteilung eines gesamten Spek trums in gleichgroße Subbänder wird aus Gründen der Einfach heit bevorzugt, wobei jedoch eine Unterteilung in ungleiche Subbänder ebenfalls möglich wäre, beispielsweise angelehnt an die psychoakustischen Frequenzgruppen. Jedes Subband wird daraufhin einer inversen modifizierten diskreten Cosi nus-Transformation unterzogen. Im Falle von langen Blöcken läuft die IMDCT einmal ab und empfängt 32 Eingangswerte. Im Falle von kurzen Blöcken werden acht aufeinanderfolgende IMDCTs ausgeführt, und zwar jeweils mit 4 der Spektralko effizienten, derart, daß sich am Ausgang wieder 32 Quasi- Zeitabtastwerte ergeben. Diese werden dann dem Prädiktor 504 zugeführt, der wiederum 32 geschätzte Quasi-Zeitabtastwerte erzeugt, die mittels der MDCT 506 transformiert werden. Im Falle von langen Blöcken wird eine einzige MDCT mit 32 zeitlichen Werten durchgeführt, während im Falle von kurzen Blöcken acht zeitlich aufeinanderfolgende MDCTs mit jeweils 4 Abtastwerten ausgeführt werden. Obwohl in Fig. 5 nur ein Zweig für das nullte Subband dargestellt ist, sei festgehalten, daß für jedes Subband ein identischer Zweig existiert, wenn die Subbänder alle die gleiche Länge haben. Haben die Subbänder unterschiedliche Längen, so sind die Ordnungen der IMDCT bzw. der MDCT daran angepaßt. Für eine praktische Implementation bietet sich eine parallele Verarbeitung an. Selbstverständlich ist jedoch auch eine serielle Verarbeitung der Subbänder hintereinander möglich, wenn entsprechende Speicherkapazitäten vorgesehen werden. Die Ausgangswerte der MDCT 506 für jedes Subband werden in eine Einrichtung 522 zum Rückgängigmachen der Unterteilung, d. h. in eine inverse Unterteilungseinrichtung, eingespeist, um im Falle des bevorzugten Ausführungsbeispiels auf AAC- MDCT-Ebene einen geschätzten Satz von Spektralwerten auszugeben.

Fig. 6 zeigt eine weitere detaillierte Darstellung des Prä diktors 504. Das Herzstück des Prädiktors 504 ist beim be vorzugten Ausführungsbeispiel ein sogenannter LMSL-Prädiktor 504a, der eine Längen n = 32 hat. Details über den LMSL-Prä diktor sind in dem Buch "Adaptive Signal Processing", Ber nard Widrow, Samuel Stearns, Prentice-Hall, 1995, S. 99 ff., zu finden. Dem LMSL-Prädiktor 504a ist eine Zeitverzöge rungsstufe 504b vorgeschaltet. Der Prädiktor 504 umfaßt eingangsseitig ferner einen Parallel-Seriell-Wandler 504c und ausgangseitig einen Seriell-Parallel-Wandler 504d. Derselbe hat ferner eine Prädiktionsgewinnberechnungsein richtung 504e, die das Ausgangssignal des Prädiktors 504a mit dem Eingangssignal vergleicht, um feststellen zu können, ob ein stationäres Signal oder ein instationäres Signal verarbeitet worden ist. Die Prädiktionsgewinnberechnungsein richtung 504e liefert ausgangsseitig das Prädiktionsgewinn signal 516, das zur Steuerung des Schalters 518 (Fig. 3) verwendet wird, um entweder prädizierte Spektralkoeffizien ten oder durch Rauschersetzung gewonnene Spektralkoeffizien ten zur Fehlerverschleierung zu verwenden. Der Prädiktor 504 umfaßt ferner in seiner Implemention als LMSL-Prädiktor zwei Schalter 504f und 504g, die zwei Schalterstellungen haben. Die Schalterstellung "1" betrifft den Fall, daß Spektralko effizienten des folgenden Blocks fehlerfrei sind, während die Schalterstellung "2" den Fall betrifft, daß Spektral koeffizienten des folgenden Satzes fehlerhaft sind. In Fig. 6 ist der Fall gezeichnet, bei dem die Spektralkoeffizienten fehlerhaft sind. In diesem Fall wird am Schalter 504g statt des Eingangssignals ein Referenzsignal mit einem Wert von 0 in den Prädiktor eingespeist. Im Fall von fehlerfreien Spek tralkoeffizienten (Schalterstellung "1" des Schalters 504g) werden dagegen die Ausgangswerte des Parallel-Seriell-Wand lers von unten in den LMSL-Prädiktor eingespeist.

Im Falle der Anwendung des erfindungsgemäßen Fehlerver schleierungsverfahrens im Zusammenhang mit einem AAC-Codie rer wird es bevorzugt, für sämtliche Vorwärts- bzw. Rück wärtstransformationen die entsprechenden Transformationsal gorithmen (MDCT bzw. IMDCT) zu verwenden. Für die Fehlerver schleierung ist es jedoch nicht notwendig, daß zur Rück wärts- bzw. zur Vorwärtstransformation dasselbe Transforma tionsverfahren eingesetzt wird, das bei der Codierung des Audiosignals verwendet wurde, um die Spektralkoeffizienten zu bilden.

Aufgrund der Unterteilung des Spektrums in Subbänder und aufgrund der einzelnen Transformationen für jedes Subband werden für jedes Subband Frequenz-Zeitbereichs-Transforma tionen mit niedrigerer Ordnung als der Frequenzauflösung entsprechend verwendet. Somit werden spezielle Schätzwerte für tonale Signalanteile in der Zwischenebene mittels des Prädiktors erzeugt. Als Vorwärtstransformation/Synthese wer den Zeit-Frequenzbereich-Transformationen niedrigerer Ord nung als der ursprünglichen Frequenzauflösung entsprechend verwendet, wobei die gleiche Ordnung gewählt wird wie bei der benutzten Frequenz-Zeitbereichs-Transformation. Somit liefert die erfindungsgemäße Fehlerverschleierung einerseits Flexibilität unter Ausnutzung von Vorkenntnissen spektraler Eigenschaften von Audiosignalen und andererseits eine Unab hängigkeit von dem im Codierer verwendeten Transformations verfahren durch Erzeugung der Schätzwerte im Quasi-Zeitsi gnal, also nicht auf Spektralkoeffizientenebene. Wenn die Prädiktion im Quasi-Zeitbereich zur Ersetzung tonaler Si gnalanteile eingesetzt wird, und wenn die Rauschersetzung für rauschhafte Spektralanteile verwendet wird, so können Fehler für eine große Klasse von Audiosignalen selbst bei vollständigem Blockverlust derart verschleiert werden, daß nahezu keine hörbaren Störungen auftreten. Versuche haben gezeigt, daß bei nicht allzu kritischen Testsignalen normale Hörer, d. h. ungeschulte Testhörer, selbst bei vollständigem Blockverlust nur in einem von 10 Fällen Unregelmäßigkeiten im Audiosignal gehört haben.

Claims

1. Verfahren zum Verschleiern eines Fehlers in einem co dierten Audiosignal, wobei das codierte Audiosignal auf einanderfolgende Sätze von Spektralkoeffizienten auf weist, wobei ein Satz von Spektralkoeffizienten eine spektrale Darstellung für einen Satz von Audioabtast werten ist, mit folgenden Schritten:
Unterteilen (14) eines aktuellen Satzes von Spektral koeffizienten in mindestens zwei Subbänder mit unter schiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumindest zwei Spektralkoeffi zienten aufweist;
Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektralkoeffizienten des einen Subbandes zu erhalten;
Durchführen (18) einer Prädiktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralko effizienten des einen Subbandes, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den ak tuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbe reich wie das Subband des aktuellen Satzes umfaßt;
Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung um zumindest zwei geschätzte Spektralkoeffi zienten für das Subband des folgenden Satzes zu erhal ten;
Bestimmen (26) ob ein Spektralkoeffizient des Subbands des folgenden Satzes fehlerhaft ist; und
als Reaktion auf den Schritt des Bestimmens, falls ein fehlerhafter Spektralkoeffizient vorliegt, Verwenden (28) eines geschätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den fehlerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern.

2. Verfahren nach Anspruch 1, bei dem das eine Subband, das im Schritt des Rückwärts-Transformierens (16) Verarbei tet wird, niederfrequente Spektralkoeffizienten auf weist, während das andere der mindestens zwei Subbänder höherfrequente Spektralkoeffizienten aufweist.

3. Verfahren nach Anspruch 1 oder 2, bei dem die Anzahl der Spektralkoeffizienten in einem Satz von Spektralkoeffi zienten gleich der Anzahl von Spektralkoeffizienten in einem Block (702) erster Länge und das N-fache der Spek tralkoeffizienten in einem Block (704) zweiter Länge ist, und bei dem N Blöcke (704) mit der zweiten Länge hintereinander auftreten, wobei
der Schritt des Unterteilens (14) derart ausgeführt wird, daß die Subbänder der Blöcke mit der ersten Länge gleiche Frequenzbereiche umfassen, wie die Subbänder der Blöcke mit der zweiten Länge, derart, daß die Anzahl der Spektralkoeffizienten eines Subbandes des Blocks mit der ersten Länge gleich dem N-fachen der Anzahl der Spek tralkoeffizienten des entsprechenden Subbandes des Blocks mit der zweiten Länge ist;
der Schritt des Rückwärtstransformierens (16) für jedes entsprechende Subband der N Blöcke mit der zweiten Länge nacheinander ausgeführt wird, um eine zeitliche Darstel lung der Spektralkoeffizienten entsprechender Subbänder der N Blöcke mit der zweiten Länge zu erhalten;
der Schritt des Durchführens (18) einer Prädiktion mit der zeitlichen Darstellung sämtlicher entsprechender Subbänder der N Blöcke mit der zweiten Länge durchge führt wird; und
der Schritt des Vorwärtstransformierens (20) für jedes entsprechende Subband der N Blöcke mit der zweiten Länge nacheinander durchgeführt wird.

4. Verfahren nach einem der vorhergehenden Ansprüche, bei dem im Schritt des Unterteilens (14) eine Vielzahl von Subbändern erzeugt wird, derart, daß alle Subbänder zu sammen die spektrale Darstellung des codierten Audiosig nals in einem Satz von Spektralkoeffizienten bilden.

5. Verfahren nach einem der vorhergehenden Ansprüche, bei dem nach dem Schritt des Bestimmens (26), ob ein Spek tralkoeffizient eines Subbands fehlerhaft ist, folgender Schritt ausgeführt wird:
Bestimmen (504e), ob der Spektralkoeffizient einen to nalen Anteil des uncodierten Audiosignals darstellt, aufgrund eines Vergleichs des Spektralkoeffizienten mit dem entsprechenden geschätzten Spektralkoeffizienten;
falls der Spektralkoeffizient als tonal bestimmt wird, Verwenden des geschätzten Spektralkoeffizientens, und falls der Spektralkoeffizient als nicht-tonal bestimmt wird, Durchführen einer Rauschersetzung (514) für einen fehlerhaften Spektralkoeffizienten des folgenden Satzes.

6. Verfahren nach einem der Ansprüche 3 bis 5, bei dem die Spektralkoeffizienten MDCT-Koeffizienten sind, die Länge eines Satzes der Länge eines langen Blocks entspricht und 1024 MDCT-Koeffizienten beträgt, während ein Satz von Spektralkoeffizienten acht Blöcke kurzer Länge um faßt, von denen jeder 128 MDCT-Koeffizienten aufweist, und bei dem im Schritt des Unterteilens 32 Subbänder je 32 MDCT-Koeffizienten für einen langen Block bzw. je 4 MDCT-Koeffizienten für einen kurzen Block gebildet werden.

7. Verfahren nach einem der vorhergehenden Ansprüche, bei dem im Schritt des Durchführens (18) der Prädiktion ein adaptiver rückgekoppelter Prädiktor (504a) verwendet wird, der vorzugsweise ein LMSL-Prädiktor ist.

8. Verfahren nach einem der vorhergehenden Ansprüche, bei dem der Transformationsalgorithmus, der dem codierten Audiosignal zugrunde liegt, der gleiche Transformations algorithmus ist, der im Schritt des Rückwärts-Transfor mierens (16) und im Schritt des Vorwärtstransformierens (20) verwendet wird.

9. Verfahren nach einem der vorhergehenden Ansprüche, bei dem der Transformationsalgorithmus, der im Schritt des Rückwärts-Transformierens (16) verwendet wird, genau invers zu dem Transformationsalgorithmus ist, der im Schritt des Vorwärts-Transformierens (20) verwendet wird.

10. Verfahren zum Decodieren eines codierten Audiosignals, das aufeinanderfolgende Sätze von Spektralkoeffizienten aufweist, wobei ein Satz von Spektralkoeffizienten eine spektrale Darstellung für einen Satz von Audioabtastwer ten ist:
Empfangen (10) eines aktuellen Satzes von Spektralko effizienten;
Unterteilen (14) eines aktuellen Satzes von Spektral koeffizienten in mindestens zwei Subbänder mit unter schiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumindest zwei Spektralko effizienten aufweist;
Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektralkoeffizienten des einen Subbandes zu erhalten;
Durchführen (18) einer Prädiktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralko effizienten des einen Subbandes, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den ak tuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbe reich wie das Subband des aktuellen Satzes umfaßt;
Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung um zumindest zwei geschätzte Spektralkoeffi zienten für das Subband des folgenden Satzes zu erhal ten;
Empfangen (24) eines folgenden Satzes von Spektralkoef fizienten und Unterteilen des folgenden Satzes in Sub bänder, die den gleichen Frequenzbereich wie die Subbän der des aktuellen Satzes umfassen;
Bestimmen (26) ob ein Spektralkoeffizient des Subbands des folgenden Satzes fehlerhaft ist;
als Reaktion auf den Schritt des Bestimmens, falls ein fehlerhafter Spektralkoeffizient vorliegt, Verwenden (28) eines geschätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den fehlerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern; und
Verarbeiten (30) des folgenden Satzes unter Benutzung des im Schritt des Verwendens (28) verwendeten geschätz ten Spektralkoeffizienten, um den folgenden Satz von Au dioabtastwerten zu erhalten.

11. Verfahren nach Anspruch 10, bei dem die Spektralkoeffi zienten des codierten Audiosignals Entropie-codiert und quantisiert sind, das vor dem Schritt des Empfangens (10) des aktuellen Satzes bzw. des folgenden Satzes fol gende Schritte aufweist:
Rückgängigmachen (200) der Entropie-Codierug um quanti sierte Spektralkoeffizienten zu erhalten;
Requantisieren (300) der quantisierten Spektralkoeffi zienten, um requantisierte Spektralkoeffizienten zu er halten;
und bei dem der Schritt des Verarbeitens folgenden Schritt aufweist:
Rücktransformieren (400) des folgenden Satzes unter Ver wendung eines Transformationsalgorithmus, der zu dem Transformationsalgorithmus invers ist, der zum Transfor mieren verwendet wurde, um die Spektralkoeffizienten des codierten Audiosignals zu erhalten.

12. Vorrichtung zum Verschleiern eines Fehlers in einem co dierten Audiosignal, wobei das codierte Audiosignal auf einanderfolgende Sätze von Spektralkoeffizienten auf weist, wobei ein Satz von Spektralkoeffizienten eine spektrale Darstellung für einen Satz von Audioabtast werten ist, mit folgenden Merkmalen:
einer Einrichtung (520) zum Unterteilen (14) eines ak tuellen Satzes von Spektralkoeffizienten in mindestens zwei Subbänder mit unterschiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumin dest zwei Spektralkoeffizienten aufweist;
einer Einrichtung (502) zum Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektral koeffizienten des einen Subbandes zu erhalten;
einer Einrichtung (504) zum Durchführen (18) einer Prä diktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralkoeffizienten des einen Subban des, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den aktuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbereich wie das Subband des aktuellen Satzes umfaßt;
einer Einrichtung (506) zum Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung, um zumindest zwei geschätzte Spektralkoeffizienten für das Subband des folgenden Satzes zu erhalten;
einer Einrichtung zum Bestimmen (26) ob ein Spektralko effizient des Subbands des folgenden Satzes fehlerhaft ist; und
einer Einrichtung (512) zum Verwenden (28) eines ge schätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den feh lerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern.

13. Vorrichtung zum Decodieren eines codierten Audiosignals, das aufeinanderfolgende Sätze von Spektralkoeffizienten aufweist, wobei ein Satz von Spektralkoeffizienten eine spektrale Darstellung für einen Satz von Audioabtastwer ten ist:
einer Einrichtung (100) zum Empfangen (10) eines aktu ellen Satzes von Spektralkoeffizienten;
einer Einrichtung (520) zum Unterteilen (14) eines aktu ellen Satzes von Spektralkoeffizienten in mindestens zwei Subbänder mit unterschiedlichen Frequenzbereichen, wobei ein Subband der mindestens zwei Subbänder zumin dest zwei Spektralkoeffizienten aufweist;
einer Einrichtung (502) zum Rückwärts-Transformieren (16) der Spektralkoeffizienten des einen Subbandes, um eine zeitliche Darstellung der zumindest zwei Spektral koeffizienten des einen Subbandes zu erhalten;
einer Einrichtung (504) zum Durchführen (18) einer Prä diktion unter Verwendung der zeitlichen Darstellung der zumindest zwei Spektralkoeffizienten des einen Subban des, um eine geschätzte zeitliche Darstellung für ein Subband eines auf den aktuellen Satz folgenden Satzes zu erhalten, wobei das Subband des folgenden Satzes den gleichen Frequenzbereich wie das Subband des aktuellen Satzes umfaßt;
einer Einrichtung (506) zum Vorwärts-Transformieren (20) der geschätzten zeitlichen Darstellung um zumindest zwei geschätzte Spektralkoeffizienten für das Subband des folgenden Satzes zu erhalten;
einer Einrichtung (502, 510) zum Empfangen (24) eines folgenden Satzes von Spektralkoeffizienten und zum Unterteilen des folgenden Satzes in Subbänder, die den gleichen Frequenzbereich wie die Subbänder des aktuellen Satzes umfassen;
einer Einrichtung zum Bestimmen (26) ob ein Spektralko effizient des Subbands des folgenden Satzes fehlerhaft ist;
einer Einrichtung (512) zum Verwenden (28) eines ge schätzten Spektralkoeffizienten statt eines fehlerhaften Spektralkoeffizienten des folgenden Satzes, um den feh lerhaften Spektralkoeffizienten des folgenden Satzes zu Verschleiern; und
einer Einrichtung zum Verarbeiten (30) des folgenden Satzes unter Benutzung des geschätzten Spektralkoeffi zienten, um den folgenden Satz von Audioabtastwerten zu erhalten.