DE19959037B4

DE19959037B4 - Verfahren zur Dekodierung von digitalen Audiodaten

Info

Publication number: DE19959037B4
Application number: DE19959037A
Authority: DE
Inventors: Claus Kupferschmidt; Volker SCHADE-BÜNSOW; Torsten Mlasko; Marc Klein Middelink
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 1999-12-08
Filing date: 1999-12-08
Publication date: 2004-04-29
Anticipated expiration: 2019-12-09
Also published as: US6703948B1; DE50006984D1; EP1245024B1; DE19959037A1; WO2001043120A8; JP2012113318A; EP1245024A1; JP5031963B2; WO2001043120A1; JP2003516559A; TW516274B

Abstract

Verfahren zur Decodierung von digitalen Audiodaten, wobei als Schritte der Decodierung eine Fehlererkennung, eine Dequantisierung und eine Filterung der digitalen Audiodaten durchgeführt werden, wobei anhand der Fehlererkennung ein Maß der Übertragungsqualität der digitalen Audiodaten ermittelt wird, dadurch gekennzeichnet, daß in Abhängigkeit des Maßes Entzerrerwerte bestimmt werden, mittels derer die Dequantisierung durchgeführt wird.

Description

Stand der Technik
Die Erfindung geht aus von einem Verfahren zur Dekodierung von digitalen Audiodaten nach der Gattung des unabhängigen Patentanspruchs.
Es ist bei dem digitalen Rundfunkübertragungsverfahren DAB (Digital Audio Broadcasting) bereits bekannt, daß eine Quellendekodierung eine Fehlererkennung- und korrektur, eine Dequantisierung und eine Filterung der Daten umfaßt. Bei einer vorhergehenden Kanalkodierung werden fehlererkennende und -korrigierende Codes verwendet, während bei der Decodierung der digitalen Audiodaten an sich eine Prüfsumme (englisch: Cyclic Redundancy Check = CRC) verwendet wird und wenn ein Fehler erkannt wird, daß dann äquivalente vorhergehende Daten die fehlerbehafteten Daten ersetzen.

In der Offenlegungsschrift DE-44 09 960 A1 wird ein Verfahren zur Verminderung der subjektiven Störempfindungen bei störungsbehaftetem Empfang bei Verwendung von digital übertragenen Tonsignalen beschrieben. Um bei digitalen Hörfunkübertragungsverfahren auch bei schlechten Empfangssituationen mit häufigem Stummschalten ein subjektiv angenehmes Hören zu erzielen, wird der Pegel des empfangenen Tonsignals graduell verringert. Wenn sich der Empfang so verbessert hat, dass allein durch Anwendung von Fehlerkorrektur und Fehlerverschleierun das wiedergegebene Tonsignal als nicht unangenehm empfunden wird, wird der Pegel des Tonsignals wieder graduell auf den Normalwert angehoben.

In der Offenlegungssschrift DE 42 02 140 A1 wird ein Verfahren zur Übertragung digitaler Audiosignale beschrieben. Die Offenlegungsschrift beschreibt die Rahmenstruktur von DAB (Digital Audio Broadcasting), wobei der Rahmen mehrere Teile aufweist: einen Header, ein Fehlerprüf- und/oder Korrekturteil mit einem vorzugsweise CRC-Schutzwort (Cyclic Redundancy Check), ein Audiodatenteil mit unter anderem einer Bit-Zuordnungstabelle, eine Skalenfaktorauswahlinformation, ein oder mehrere Skalenfaktoren pro übertragenem Subband, Abtastwerte, im Wesentlichen bedeutungslose Füllbits und einem Zusatzinformationsteil mit audiosignalbezogenen Zusatzinformationen.

Der Erfindung liegt die Aufgabe zugrunde, eine Fehlerverschleierung an digitalen Audiodaten in Abhängigkeit von der Übertragungsqualität durchzuführen. Gelöst wird diese Aufgabe durch ein Verfahren mit den Merkmalen des Patentanspruchs 1. Zweckmäßige Weiterbildungen sind in den Unteransprüchen angegeben.

Das erfindungsgemäße Verfahren zur Dekodierung von digitalen Audiodaten mit den Merkmalen des unabhängigen Patentanspruchs hat demgegenüber den Vorteil, daß in Abhängigkeit einer Fehlerzahl, die mittels der Prüfsumme festgestellt wird, eine spektrale Formung der Audiosignale während der Dequantisierung durchgeführt wird. Hierdurch werden vorteilhafterweise auftretende Fehler kompensiert, indem durch die Fehlerzahl abgeschätzt wird, wie das Audiospektrum verändert werden muß, um die Auswirkungen dieser Fehler zu minimieren. Es findet also eine Fehlerverschleierung statt.

Das erfindungsgemäße Verfahren weist einen geringen Zusatzaufwand auf und kann in jedem Audiodecoder implementiert werden. Insbesondere, daß die Fehler individuell verschleiert werden, führt dazu, daß ein gleitender Qualitätsverlust erreicht wird, wie er sonst bei digitalen Daten nicht möglich ist. Das ist für einen Hörer angenehm, obwohl er dennoch einen Qualitätsverlust bemerken wird.

Durch die in den abhängigen Ansprüchen aufgeführten Maßnahmen und Weiterbildungen sind vorteilhafte Verbesserungen des im unabhängigen Patentanspruchs angegebenen Verfahrens zur Dekodierung von digitalen Audiodaten möglich.

Besonders vorteilhaft ist, daß die Werte entweder aus einem Speicher geladen werden und/oder mittels eines Prozessors berechnet werden. Damit wird einerseits ein Wissen genutzt, mit dem die abgespeicherten Entzerrerwerte ursprünglich ermittelt wurden, und die Entzerrerwerte können sich andererseits durch eine Berechnung auf die jeweilige Situation anpassen, wodurch ein adaptives Verhalten erreicht wird. Dadurch wird die Fehlerkorrektur optimal angepaßt, so daß der Benutzer eines Rundfunkempfängers mit dem erfindungsgemäßen Verfahren kein schlagartiges Abbrechen der Qualität der Audiosignale bemerkt.

Darüber hinaus ist es von Vorteil, daß das Maß für die Qualität der digitalen Audiodaten mit Schwellwerten verglichen wird. Dadurch kann in Abhängigkeit, ob das Maß über vorgegebenen Schwellwerten liegt oder nicht entsprechende Entzerrerwerte eingestellt werden. Dies ermöglicht eine einfache Anpassung an eine jeweilige Fehlersituation. Insbesondere, wenn das Maß eine sehr geringe Fehlerzahl oder Fehlerfreiheit anzeigt, kann auf Fehlerverschleierungsmaßnahmen verzichtet werden. Zeigt das Maß eine solche Fehlerzahl an, die über dem größten Schwellwert liegt, d.h. daß auch die Fehlerkorrektur keine Abhilfe mehr bietet, dann wird eine Stummschaltung aktiviert. Damit wird dem Benutzer in Abhängigkeit von der Fehlerzahl eine optimierte Fehlerkorrektur angeboten.

Zeichnung
Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und in der nachfolgenden Beschreibung näher erläutert. Es zeigen 1 ein Blockschaltbild des erfindungsgemäßen Verfahrens und 2 einem MPEG-1-Layer-II-Rahmen.
Beschreibung Treten bei digitalen Rundfunkübertragungsverfahren wie DAB schlechte Empfangsbedingungen auf, so daß in den digitalen Audiodaten auftretende Fehler nicht mehr korrigiert werden können, wird die Audioqualität schlagartig sehr schlecht, da nicht wie bei analogen Rundfunkübertragungsverfahren ein gleitender Übergang von einer sehr guten Qualität zu einer sehr schlechten Qualität möglich ist. Tritt bei digitalen Audiodaten ein nicht zu korrigierender Fehler auf und wird dieser Fehler hörbar gemacht, erhält der Hörer keinen dem digitalen Übertragungsverfahren entsprechenden Höreindruck, der bei analogen Audiosignalen sehr wohl vorhanden ist, bei denen auch bei einem sehr schlechten Empfang zumindest Fragmente der korrekten Audiosignale hörbar sind. Bei digitalen Übertragungsverfahren wird jedoch CD-Qualität bei der akustischen Wiedergabe erwartet.
DAB ist ein digitales Rundfunkübertragungsverfahren, das insbesondere für den mobilen Empfang geeignet ist, da eine Verteilung der zu übertragenden Daten auf viele Frequenzträger DAB robust gegenüber einer frequenzselektiven Dämpfung macht, da in einem solchen Fall nur ein geringer Prozentsatz der übertragenen Daten unter der frequenzselektiven Dämpfung leidet. Darüber hinaus bietet DAB mit seiner Rahmenstruktur eine komfortable Möglichkeit, Multimediadaten zu übertragen. DVB (Digital Video Broadcasting) und DRM (Digital Radio Mondial) sind zu DAB verwandte Verfahren, die sich hinsichtlich der Übertragungsrate, der Sendefrequenzen und der Rahmenstruktur unterscheiden.
Sind diese schlechten Empfangsbedingungen von nur kurzer Dauer, dann wird die durch eine Kanalkodierung implementierte Fehlerkorrektur die dadurch erzeugten Fehler korrigieren können. Eine Kanalkodierung, die sendeseitig vorgenommen wird, fügt den durch eine Quellenkodierung um eine Irrelevanz reduzierten Daten wieder Redundanz hinzu, die im Empfänger während einer Kanaldekodierung genutzt wird, um Fehler in den Audiodaten zu erkennen und zu korrigieren. Aus der Redundanz kann für die empfangenen Daten rechnerisch der ursprüngliche Zustand rekonstruiert werden, falls nicht zu viele Daten fehlerbehaftet sind. Solche hier verwendeten, fehlerkorrigierenden Codes sind Blockcodes und Faltungscodes.
Eine weitere Fehlererkennung, die in der Quellendekodierung implementiert ist und mittels einer Prüfsumme arbeitet, bildet eine zweite Stufe, um Fehler zu erkennen und zu korrigieren. Hierbei werden, wenn ein Fehler erkannt wird, vorher abgespeicherte Daten aktuelle fehlerbehaftete Daten ersetzen. Es liegt damit eine Fehlerverschleierung vor, aber, da zeitlich aufeinanderfolgende Audiodaten eine enge Korrelation zueinander aufweisen, ist es eine gute Schätzung, um aktuell fehlerbehaftete Daten zu ersetzen.
Liegt also eine Fehlererkennung für einen Rahmen, mittels dessen Audiodaten übertragen werden, vor, und es wird dieser Rahmen als fehlerhaft erkannt, dann wird beispielsweise der vorhergehende Rahmen verwendet, um diesen fehlerbehafteten Rahmen zu ersetzen, falls der vorhergehende Rahmen fehlerfrei vorliegt. Ist das nicht der Fall, wird eine Stammschaltung aktiviert. Treten solche schlechten Empfangsbedingungen längerfristig auf, dann ist es sehr wahrscheinlich, daß ein Hin- und Herschalten zwischen Stammschaltung und den Audiodaten zu einem äußerst störenden Effekt führt.
Bei DAB (Digital Audio Broadcasting) werden sendeseitig die Audiosignale in Frequenzbereiche aufgeteilt. Für jeden Frequenzbereich wird der Frequenzwert mit der größten Signalleistung als Referenzwert verwendet, bei DAB als Skalenfaktor bezeichnet. Die übrigen Signalwerte in diesem Frequenzbereich werden auf diesen Referenzwert normiert. Damit wird der Abstand von der kleinsten Signalleistung zur größten Signalleistung erheblich reduziert. Die Referenzwerte werden dann mit den normierten Audiodaten zum Empfänger hin übertragen.
Ist die zeitliche Abfolge der Referenzwerte innerhalb eines Rahmens gleich oder sehr ähnlich, dann wird für diesen Frequenzbereich nur ein Referenzwert übertragen, um Übertragungskapazität einzusparen. Bei DAB werden für einen Frequenzbereich (engl. Subband) 36 zeitlich aufeinanderfolgende Abtastwerte genommen und in drei Gruppen zu je zwölf Abtastwerten aufgeteilt. Für jede Gruppe wird ein Referenzwert definiert. Sind zwei oder gar alle drei Referenzwerte gleich oder zumindest sehr ähnlich, dann wird dann nur jeweils ein Referenzwert übertragen. In dem DAB-Rahmen ist vermerkt für welche Gruppen von Abtastwerten ein Referenzwert gilt.
Im Empfänger wird für jeden Rahmen eine Fehlererkennung mittels Prüfsumme (engl. Cyclic Redundancy Check = CRC) durchgeführt und auch für die Referenzwerte. Die Fehlererkennung für die Referenzwerte wird für das erfindungsgemäße Verfahren verwendet. D.h. die Fehlerzahl, die bei den Referenzwerten ermittelt wird, bestimmt, welche Maßnahme das erfindungsgemäße Verfahren trifft.
Erfindungsgemäß wird die ermittelte Fehlerzahl bei den Referenzwerten mit Schwellwerten verglichen. Über oder unter welchem Schwellwert die aktuelle Fehlerzahl liegt, bestimmt welche Aktion durchgeführt wird.
In 1 ist ein Blockschaltbild der erfindungsgemäßen Decodierung dargestellt. Das dargestellte Verfahren läuft auf einem Prozessor, der der Audiodekoder ist, ab.
Die codierten Audiodaten 1 werden in einem Block 2, einem Demultiplexverfahren und einer Fehlererkennung für Referenzwerte unterzogen. Bei DAB sind Daten von verschiedenen Rundfunkprogrammen in einem Datenstrom zu einem Multiplex zusammengefaßt. Im Empfänger werden dann die Daten, die zu dem eingestellten Rundfunkprogramm gehören, mittels eines Demultiplexverfahren aus dem Datenstrom herausgefiltert, um diese Daten zu dekodieren, so daß sie dargestellt werden können.
Über einen ersten Ausgang übergibt der Block 2 einem Block 13 Daten über die erkannten Fehler und zwar die Zahl der erkannten Fehler. Anhand dieser wird im Block 13 ein Satz von Entzerrerwerten aus einem Speicher, der an den Audiodekoder angeschlossen ist, geladen. Dafür sind in dem Speicher verschiedene Sätze von Entzerrerwerten abgelegt, die mit einer jeweiligen Fehlerzahl verknüpft sind. Anhand der Fehlerzahl wird dann der entsprechende Satz von Entzerrerwerten ausgewählt und geladen.
Alternativ können die Entzerrerwerte auch mittels einer vorgegebenen Gleichung berechnet werden. Weiterhin kann ein Satz von Entzerrerwerten aus dem Speicher geladen werden, um dann ausgehend von diesen Entzerrerwerten neue Sätze von Entzerrerwerten zu berechnen.
Über einen zweiten Ausgang übergibt der Block 2 einem Block 3 die digitalen Audiodaten, wobei im Block 3 eine Dequantisierung dieser digitalen Audiodaten unter Benutzung der ausgewählten Entzerrerkoeffizienten durchgeführt wird. Der Block 13 ist daher über einen Ausgang mit einem zweiten Eingang des Blocks 3 verbunden, um die Entzerrerwerte an den Block 3 zu übergeben.
Durch die Entzerrerwerte werden einzelne Frequenzbereiche stark abgeschwächt, so daß eine Bandbegrenzung vorliegt. Da sich Fehler in höheren Frequenzbereichen störender auswirken als Fehler in den tieferen Frequenzbereichen, wird bei einer zunehmenden Zahl von Fehlern, was mit einer entsprechenden Anzahl von Schwellwerten, mit denen die Fehlerzahl verglichen wird, schrittweise erkannt wird, damit die Bandbreite des dargestellten Audiosignals immer weiter verkleinert, bis die Fehlerzahl so hoch ist, daß eine Stammschaltung erforderlich ist. Die Fehlerverteilung in höheren und niedrigeren Frequenzbereichen ist mehr oder weniger gleich, die Fehler in den höheren Frequenzbereichen wirken sich jedoch wesentlich stärker im Höreindruck aus.
Die dequantisierten Daten werden dann vom Block 3 an den Block 4 übergeben, der die dequantisierten Daten filtert. Am Ausgang des Blocks 4 sind dann die decodierten Audiodaten bereit zur weiteren Verarbeitung.
Das ganze Verfahren wird auf einem Prozessor, der die Audiodecodierung in einem Rundfunkempfänger durchführt, implementiert.
In 2 ist ein MPEG1 Layer II Rahmen dargestellt. Diese Rahmenstruktur wird bei der Übertragung von DAB verwendet.
Der MPEG-1-Layer-II-Rahmen beginnt mit einem Rahmenkopf 6, auf den ein Feld 7 für eine Rahmenfehlererkennung folgt. Dabei wird hier eine Prüfsumme, im Englischen als Cyclic Redundancy Check bezeichnet, eingesetzt. Ist ein fehlerhafter Rahmen anhand der Prüfsumme erkannt worden, dann wird der zuletzt korrekt empfangene Rahmen den fehlerhaften Rahmen ersetzen, oder es erfolgt eine Stammschaltung für diesen Rahmen. Die Prüfsumme ist hier so gestaltet, daß nicht alle möglichen Fehler erkannt werden. Dies spart erheblich Übertragungsbandbreite, wenn auch damit nicht alle Fehler erkannt werden. Charakteristisch für die Prüfsumme ist der Test einer Bitsumme, wobei eine inhaltliche Betrachtung der Audiodaten, wie es beim erfindungsgemäßen Verfahren der Fall ist, unterbleibt.
Dann folgt ein Feld für eine Bitzuweisung 8. Bei DAB, wie auch bei anderen digitalen Übertragungs- und Aufzeichnungsverfahren werden die Audiosignale quantisiert. Dabei wird eine nichtlineare Quantisierung durchgeführt, wobei eine psychoakustische Quantisierungskurve zugrunde gelegt wird. Es werden Geräusche, die sich in der Nähe in Bezug auf die Frequenz zu einem aus dem Klangspektrum herausragenden Ton befinden, durch das Ohr nicht mehr wahrgenommen. Dies bezeichnet man als die Mithörschwelle. Dadurch ist es möglich, die Datenrate zu reduzieren, indem solche Geräusche, die unter der Mithörschwelle liegen, aus den Daten entfernt werden. Es werden dabei auch die verschiedenen Frequenzbereiche unterschiedlich fein quantisiert, wobei die Feinheit der Quantisierung dadurch bestimmt ist, daß das Quantisierungsrauschen noch unterhalb der Mithörschwelle liegt. Aus dieser unterschiedlichen Quantisierung pro Frequenzbereich ergibt sich, daß unterschiedlich viele Bits pro Frequenzbereich zuzuweisen sind. Zum Beispiel schwankt die Bitzuweisung pro Frequenzbereich zwischen 3 und 16 Bit.
In dem nächsten Feld 9 wird eine Referenzwerteauswahl getroffen. Es kommt durchaus vor, daß Referenzwerte für mehrere Gruppen von zeitlich aufeinanderfolgenden Abtastwerten gelten, wobei die Referenzwerte gleiche oder zumindest sehr ähnliche Signalleistungswerte aufweisen. Dies wurde bereits oben dargelegt. Daher ist es nicht notwendig, für jeden Frequenzbereich mehrere Referenzwerte zu übertragen, wenn ein Referenzwert mehrere Gruppen repräsentiert. In diesem Feld 9 ist nun beschrieben, welche Referenzwerte für welche Gruppen von Abtastwerten zur Denormierung zu verwenden sind.
Im Feld 10 sind dann die Referenzwerte selbst abgespeichert. Im Feld 11 sind die eigentlichen Audiodaten, die mit den Referenzwerten denormiert werden, abgelegt. Im Feld 12 befinden sich Zusatzdaten, die programmbegleitende Informationen umfassen und vor allem die Prüfsumme für die Referenzwerte des folgenden Rahmens.
Alternativ kann vorgesehen sein, daß ein Zähler als Maß der Übertragungsqualität pro Fehler eines Rahmens inkrementiert und pro fehlerfreiem Rahmen dekrementiert wird. Wird dieser Zähler mit Schwellwerten verglichen, kann damit abgeschätzt werden, ob nur kurzfristige Störungen auftreten oder diese häufiger vorkommen. Es wird also eine Gedächtnisfunktion implementiert, die die Geschichte der zeitlichen Fehlerhäufigkeit berücksichtigt. Tritt kurzfristig eine Störung auf, so wird anhand des Zählers ein nur geringer Fehlerstand ermittelt und auf Fehlerverschleierungsmaßnahmen kann verzichtet werden. Das Verfahren zeigt damit vorteilhafterweise eine Trägheit, das aufgrund vereinzelter Fehler nicht zu Fehlerverschleierungsmaßnahmen greift. Steigt jedoch der Zähler stetig, müssen Fehlerverschleierungsmaßnahmen eingesetzt werden, im Extremfall sogar eine Stammschaltung, da die Fehlerrate zu groß wird, um die Fehler sinnvoll zu verschleiern. Werden Fehlerverschleierungsverfahren eingesetzt, werden die oben beschriebenen Entzerrerwerte bestimmt, um insbesondere höhere Frequenzbereiche zu bedämpfen.
Alternativ können auch zwei Zähler verwendet werden, die nach einem optimalen Empfang wieder zurückgesetzt werden.
Referenzwerte können auch in Gruppen zusammengefaßt werden, wobei dann, wenn ein Fehler in einem Referenzwert erkannt wird, die ganze Gruppe durch abgespeicherte Referenzwerte ersetzt wird. Dies führt zu einer Aufwandsersparnis.

Claims

Verfahren zur Decodierung von digitalen Audiodaten, wobei als Schritte der Decodierung eine Fehlererkennung, eine Dequantisierung und eine Filterung der digitalen Audiodaten durchgeführt werden, wobei anhand der Fehlererkennung ein Maß der Übertragungsqualität der digitalen Audiodaten ermittelt wird, dadurch gekennzeichnet, daß in Abhängigkeit des Maßes Entzerrerwerte bestimmt werden, mittels derer die Dequantisierung durchgeführt wird.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Entzerrerwerte aus einem Speicher abgerufen werden.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Entzerrerwerte berechnet werden.
Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß das Maß mit vorgegebenen Schwellwerten verglichen wird und in Abhängigkeit, über welchen Schwellwerten das Maß liegt, die Entzerrerwerte bestimmt werden.
Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß, wenn das Maß unter dem kleinsten Schwellwert liegt, keine Entzerrerwerte für die Dequantisierung verwendet werden.
Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß wenn das Maß über dem größten Schwellwert liegt, eine Stammschaltung durchgeführt wird.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die digitalen Audiodaten nach aufeinanderfolgenden Frequenzbereichen aufgeteilt werden und daß die digitalen Audiodaten für jeden Frequenzbereich normiert werden.
Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die digitalen Audiodaten in Rahmen übertragen werden.
Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß eine Fehlererkennung pro Rahmen und pro Frequenzbereich durchgeführt wird.