-
Stand der Technik
-
Die Erfindung geht aus von einem
Verfahren zur Dekodierung von digitalen Audiodaten nach der Gattung
des unabhängigen
Patentanspruchs.
-
Es ist bei dem digitalen Rundfunkübertragungsverfahren
DAB (Digital Audio Broadcasting) bereits bekannt, daß eine Quellendekodierung
eine Fehlererkennung- und korrektur, eine Dequantisierung und eine
Filterung der Daten umfaßt.
Bei einer vorhergehenden Kanalkodierung werden fehlererkennende
und -korrigierende Codes verwendet, während bei der Decodierung der
digitalen Audiodaten an sich eine Prüfsumme (englisch: Cyclic Redundancy Check
= CRC) verwendet wird und wenn ein Fehler erkannt wird, daß dann äquivalente
vorhergehende Daten die fehlerbehafteten Daten ersetzen.
-
In der Offenlegungsschrift
DE-44 09 960 A1 wird
ein Verfahren zur Verminderung der subjektiven Störempfindungen
bei störungsbehaftetem
Empfang bei Verwendung von digital übertragenen Tonsignalen beschrieben.
Um bei digitalen Hörfunkübertragungsverfahren
auch bei schlechten Empfangssituationen mit häufigem Stummschalten ein subjektiv
angenehmes Hören
zu erzielen, wird der Pegel des empfangenen Tonsignals graduell
verringert. Wenn sich der Empfang so verbessert hat, dass allein
durch Anwendung von Fehlerkorrektur und Fehlerverschleierun das
wiedergegebene Tonsignal als nicht unangenehm empfunden wird, wird
der Pegel des Tonsignals wieder graduell auf den Normalwert angehoben.
-
In der Offenlegungssschrift
DE 42 02 140 A1 wird
ein Verfahren zur Übertragung
digitaler Audiosignale beschrieben. Die Offenlegungsschrift beschreibt
die Rahmenstruktur von DAB (Digital Audio Broadcasting), wobei der
Rahmen mehrere Teile aufweist: einen Header, ein Fehlerprüf- und/oder
Korrekturteil mit einem vorzugsweise CRC-Schutzwort (Cyclic Redundancy
Check), ein Audiodatenteil mit unter anderem einer Bit-Zuordnungstabelle,
eine Skalenfaktorauswahlinformation, ein oder mehrere Skalenfaktoren
pro übertragenem
Subband, Abtastwerte, im Wesentlichen bedeutungslose Füllbits und
einem Zusatzinformationsteil mit audiosignalbezogenen Zusatzinformationen.
-
Der Erfindung liegt die Aufgabe zugrunde, eine
Fehlerverschleierung an digitalen Audiodaten in Abhängigkeit
von der Übertragungsqualität durchzuführen. Gelöst wird
diese Aufgabe durch ein Verfahren mit den Merkmalen des Patentanspruchs
1. Zweckmäßige Weiterbildungen
sind in den Unteransprüchen
angegeben.
-
Das erfindungsgemäße Verfahren zur Dekodierung
von digitalen Audiodaten mit den Merkmalen des unabhängigen Patentanspruchs
hat demgegenüber
den Vorteil, daß in
Abhängigkeit
einer Fehlerzahl, die mittels der Prüfsumme festgestellt wird, eine spektrale
Formung der Audiosignale während
der Dequantisierung durchgeführt
wird. Hierdurch werden vorteilhafterweise auftretende Fehler kompensiert,
indem durch die Fehlerzahl abgeschätzt wird, wie das Audiospektrum
verändert
werden muß,
um die Auswirkungen dieser Fehler zu minimieren. Es findet also
eine Fehlerverschleierung statt.
-
Das erfindungsgemäße Verfahren weist einen geringen
Zusatzaufwand auf und kann in jedem Audiodecoder implementiert werden.
Insbesondere, daß die
Fehler individuell verschleiert werden, führt dazu, daß ein gleitender
Qualitätsverlust
erreicht wird, wie er sonst bei digitalen Daten nicht möglich ist.
Das ist für
einen Hörer
angenehm, obwohl er dennoch einen Qualitätsverlust bemerken wird.
-
Durch die in den abhängigen Ansprüchen aufgeführten Maßnahmen
und Weiterbildungen sind vorteilhafte Verbesserungen des im unabhängigen Patentanspruchs
angegebenen Verfahrens zur Dekodierung von digitalen Audiodaten
möglich.
-
Besonders vorteilhaft ist, daß die Werte
entweder aus einem Speicher geladen werden und/oder mittels eines
Prozessors berechnet werden. Damit wird einerseits ein Wissen genutzt,
mit dem die abgespeicherten Entzerrerwerte ursprünglich ermittelt wurden, und
die Entzerrerwerte können
sich andererseits durch eine Berechnung auf die jeweilige Situation
anpassen, wodurch ein adaptives Verhalten erreicht wird. Dadurch
wird die Fehlerkorrektur optimal angepaßt, so daß der Benutzer eines Rundfunkempfängers mit
dem erfindungsgemäßen Verfahren
kein schlagartiges Abbrechen der Qualität der Audiosignale bemerkt.
-
Darüber hinaus ist es von Vorteil,
daß das Maß für die Qualität der digitalen
Audiodaten mit Schwellwerten verglichen wird. Dadurch kann in Abhängigkeit,
ob das Maß über vorgegebenen
Schwellwerten liegt oder nicht entsprechende Entzerrerwerte eingestellt
werden. Dies ermöglicht
eine einfache Anpassung an eine jeweilige Fehlersituation. Insbesondere,
wenn das Maß eine
sehr geringe Fehlerzahl oder Fehlerfreiheit anzeigt, kann auf Fehlerverschleierungsmaßnahmen
verzichtet werden. Zeigt das Maß eine
solche Fehlerzahl an, die über
dem größten Schwellwert
liegt, d.h. daß auch
die Fehlerkorrektur keine Abhilfe mehr bietet, dann wird eine Stummschaltung
aktiviert. Damit wird dem Benutzer in Abhängigkeit von der Fehlerzahl
eine optimierte Fehlerkorrektur angeboten.
-
Zeichnung
-
Ausführungsbeispiele der Erfindung
sind in der Zeichnung dargestellt und in der nachfolgenden Beschreibung
näher erläutert. Es
zeigen 1 ein Blockschaltbild
des erfindungsgemäßen Verfahrens und 2 einem MPEG-1-Layer-II-Rahmen.
-
Beschreibung Treten bei digitalen
Rundfunkübertragungsverfahren
wie DAB schlechte Empfangsbedingungen auf, so daß in den digitalen Audiodaten
auftretende Fehler nicht mehr korrigiert werden können, wird
die Audioqualität
schlagartig sehr schlecht, da nicht wie bei analogen Rundfunkübertragungsverfahren
ein gleitender Übergang
von einer sehr guten Qualität
zu einer sehr schlechten Qualität möglich ist.
Tritt bei digitalen Audiodaten ein nicht zu korrigierender Fehler
auf und wird dieser Fehler hörbar
gemacht, erhält
der Hörer
keinen dem digitalen Übertragungsverfahren
entsprechenden Höreindruck,
der bei analogen Audiosignalen sehr wohl vorhanden ist, bei denen
auch bei einem sehr schlechten Empfang zumindest Fragmente der korrekten
Audiosignale hörbar
sind. Bei digitalen Übertragungsverfahren
wird jedoch CD-Qualität
bei der akustischen Wiedergabe erwartet.
-
DAB ist ein digitales Rundfunkübertragungsverfahren,
das insbesondere für
den mobilen Empfang geeignet ist, da eine Verteilung der zu übertragenden
Daten auf viele Frequenzträger
DAB robust gegenüber
einer frequenzselektiven Dämpfung macht,
da in einem solchen Fall nur ein geringer Prozentsatz der übertragenen
Daten unter der frequenzselektiven Dämpfung leidet. Darüber hinaus
bietet DAB mit seiner Rahmenstruktur eine komfortable Möglichkeit,
Multimediadaten zu übertragen.
DVB (Digital Video Broadcasting) und DRM (Digital Radio Mondial)
sind zu DAB verwandte Verfahren, die sich hinsichtlich der Übertragungsrate,
der Sendefrequenzen und der Rahmenstruktur unterscheiden.
-
Sind diese schlechten Empfangsbedingungen
von nur kurzer Dauer, dann wird die durch eine Kanalkodierung implementierte
Fehlerkorrektur die dadurch erzeugten Fehler korrigieren können. Eine Kanalkodierung,
die sendeseitig vorgenommen wird, fügt den durch eine Quellenkodierung
um eine Irrelevanz reduzierten Daten wieder Redundanz hinzu, die im
Empfänger
während
einer Kanaldekodierung genutzt wird, um Fehler in den Audiodaten
zu erkennen und zu korrigieren. Aus der Redundanz kann für die empfangenen
Daten rechnerisch der ursprüngliche Zustand
rekonstruiert werden, falls nicht zu viele Daten fehlerbehaftet
sind. Solche hier verwendeten, fehlerkorrigierenden Codes sind Blockcodes
und Faltungscodes.
-
Eine weitere Fehlererkennung, die
in der Quellendekodierung implementiert ist und mittels einer Prüfsumme arbeitet,
bildet eine zweite Stufe, um Fehler zu erkennen und zu korrigieren.
Hierbei werden, wenn ein Fehler erkannt wird, vorher abgespeicherte
Daten aktuelle fehlerbehaftete Daten ersetzen. Es liegt damit eine
Fehlerverschleierung vor, aber, da zeitlich aufeinanderfolgende
Audiodaten eine enge Korrelation zueinander aufweisen, ist es eine
gute Schätzung,
um aktuell fehlerbehaftete Daten zu ersetzen.
-
Liegt also eine Fehlererkennung für einen Rahmen,
mittels dessen Audiodaten übertragen
werden, vor, und es wird dieser Rahmen als fehlerhaft erkannt, dann
wird beispielsweise der vorhergehende Rahmen verwendet, um diesen
fehlerbehafteten Rahmen zu ersetzen, falls der vorhergehende Rahmen
fehlerfrei vorliegt. Ist das nicht der Fall, wird eine Stammschaltung
aktiviert. Treten solche schlechten Empfangsbedingungen längerfristig
auf, dann ist es sehr wahrscheinlich, daß ein Hin- und Herschalten zwischen
Stammschaltung und den Audiodaten zu einem äußerst störenden Effekt führt.
-
Bei DAB (Digital Audio Broadcasting)
werden sendeseitig die Audiosignale in Frequenzbereiche aufgeteilt.
Für jeden
Frequenzbereich wird der Frequenzwert mit der größten Signalleistung als Referenzwert
verwendet, bei DAB als Skalenfaktor bezeichnet. Die übrigen Signalwerte
in diesem Frequenzbereich werden auf diesen Referenzwert normiert.
Damit wird der Abstand von der kleinsten Signalleistung zur größten Signalleistung
erheblich reduziert. Die Referenzwerte werden dann mit den normierten
Audiodaten zum Empfänger
hin übertragen.
-
Ist die zeitliche Abfolge der Referenzwerte innerhalb
eines Rahmens gleich oder sehr ähnlich, dann
wird für
diesen Frequenzbereich nur ein Referenzwert übertragen, um Übertragungskapazität einzusparen.
Bei DAB werden für
einen Frequenzbereich (engl. Subband) 36 zeitlich aufeinanderfolgende
Abtastwerte genommen und in drei Gruppen zu je zwölf Abtastwerten
aufgeteilt. Für
jede Gruppe wird ein Referenzwert definiert. Sind zwei oder gar
alle drei Referenzwerte gleich oder zumindest sehr ähnlich,
dann wird dann nur jeweils ein Referenzwert übertragen. In dem DAB-Rahmen ist vermerkt
für welche
Gruppen von Abtastwerten ein Referenzwert gilt.
-
Im Empfänger wird für jeden Rahmen eine Fehlererkennung
mittels Prüfsumme
(engl. Cyclic Redundancy Check = CRC) durchgeführt und auch für die Referenzwerte.
Die Fehlererkennung für
die Referenzwerte wird für
das erfindungsgemäße Verfahren
verwendet. D.h. die Fehlerzahl, die bei den Referenzwerten ermittelt
wird, bestimmt, welche Maßnahme
das erfindungsgemäße Verfahren
trifft.
-
Erfindungsgemäß wird die ermittelte Fehlerzahl
bei den Referenzwerten mit Schwellwerten verglichen. Über oder
unter welchem Schwellwert die aktuelle Fehlerzahl liegt, bestimmt
welche Aktion durchgeführt
wird.
-
In 1 ist
ein Blockschaltbild der erfindungsgemäßen Decodierung dargestellt.
Das dargestellte Verfahren läuft
auf einem Prozessor, der der Audiodekoder ist, ab.
-
Die codierten Audiodaten 1 werden
in einem Block 2, einem Demultiplexverfahren und einer
Fehlererkennung für
Referenzwerte unterzogen. Bei DAB sind Daten von verschiedenen Rundfunkprogrammen
in einem Datenstrom zu einem Multiplex zusammengefaßt. Im Empfänger werden
dann die Daten, die zu dem eingestellten Rundfunkprogramm gehören, mittels
eines Demultiplexverfahren aus dem Datenstrom herausgefiltert, um
diese Daten zu dekodieren, so daß sie dargestellt werden können.
-
Über
einen ersten Ausgang übergibt
der Block 2 einem Block 13 Daten über die
erkannten Fehler und zwar die Zahl der erkannten Fehler. Anhand
dieser wird im Block 13 ein Satz von Entzerrerwerten aus
einem Speicher, der an den Audiodekoder angeschlossen ist, geladen.
Dafür sind
in dem Speicher verschiedene Sätze
von Entzerrerwerten abgelegt, die mit einer jeweiligen Fehlerzahl
verknüpft
sind. Anhand der Fehlerzahl wird dann der entsprechende Satz von
Entzerrerwerten ausgewählt und
geladen.
-
Alternativ können die Entzerrerwerte auch mittels
einer vorgegebenen Gleichung berechnet werden. Weiterhin kann ein
Satz von Entzerrerwerten aus dem Speicher geladen werden, um dann
ausgehend von diesen Entzerrerwerten neue Sätze von Entzerrerwerten zu
berechnen.
-
Über
einen zweiten Ausgang übergibt
der Block 2 einem Block 3 die digitalen Audiodaten,
wobei im Block 3 eine Dequantisierung dieser digitalen Audiodaten
unter Benutzung der ausgewählten
Entzerrerkoeffizienten durchgeführt
wird. Der Block 13 ist daher über einen Ausgang mit einem
zweiten Eingang des Blocks 3 verbunden, um die Entzerrerwerte an
den Block 3 zu übergeben.
-
Durch die Entzerrerwerte werden einzelne Frequenzbereiche
stark abgeschwächt,
so daß eine Bandbegrenzung
vorliegt. Da sich Fehler in höheren Frequenzbereichen
störender
auswirken als Fehler in den tieferen Frequenzbereichen, wird bei
einer zunehmenden Zahl von Fehlern, was mit einer entsprechenden
Anzahl von Schwellwerten, mit denen die Fehlerzahl verglichen wird,
schrittweise erkannt wird, damit die Bandbreite des dargestellten
Audiosignals immer weiter verkleinert, bis die Fehlerzahl so hoch ist,
daß eine
Stammschaltung erforderlich ist. Die Fehlerverteilung in höheren und
niedrigeren Frequenzbereichen ist mehr oder weniger gleich, die Fehler
in den höheren
Frequenzbereichen wirken sich jedoch wesentlich stärker im
Höreindruck
aus.
-
Die dequantisierten Daten werden
dann vom Block 3 an den Block 4 übergeben,
der die dequantisierten Daten filtert. Am Ausgang des Blocks 4 sind dann
die decodierten Audiodaten bereit zur weiteren Verarbeitung.
-
Das ganze Verfahren wird auf einem
Prozessor, der die Audiodecodierung in einem Rundfunkempfänger durchführt, implementiert.
-
In 2 ist
ein MPEG1 Layer II Rahmen dargestellt. Diese Rahmenstruktur wird
bei der Übertragung
von DAB verwendet.
-
Der MPEG-1-Layer-II-Rahmen beginnt
mit einem Rahmenkopf 6, auf den ein Feld 7 für eine Rahmenfehlererkennung
folgt. Dabei wird hier eine Prüfsumme,
im Englischen als Cyclic Redundancy Check bezeichnet, eingesetzt.
Ist ein fehlerhafter Rahmen anhand der Prüfsumme erkannt worden, dann
wird der zuletzt korrekt empfangene Rahmen den fehlerhaften Rahmen
ersetzen, oder es erfolgt eine Stammschaltung für diesen Rahmen. Die Prüfsumme ist
hier so gestaltet, daß nicht
alle möglichen Fehler
erkannt werden. Dies spart erheblich Übertragungsbandbreite, wenn
auch damit nicht alle Fehler erkannt werden. Charakteristisch für die Prüfsumme ist
der Test einer Bitsumme, wobei eine inhaltliche Betrachtung der
Audiodaten, wie es beim erfindungsgemäßen Verfahren der Fall ist,
unterbleibt.
-
Dann folgt ein Feld für eine Bitzuweisung 8. Bei
DAB, wie auch bei anderen digitalen Übertragungs- und Aufzeichnungsverfahren
werden die Audiosignale quantisiert. Dabei wird eine nichtlineare Quantisierung
durchgeführt,
wobei eine psychoakustische Quantisierungskurve zugrunde gelegt
wird. Es werden Geräusche,
die sich in der Nähe
in Bezug auf die Frequenz zu einem aus dem Klangspektrum herausragenden
Ton befinden, durch das Ohr nicht mehr wahrgenommen. Dies bezeichnet
man als die Mithörschwelle.
Dadurch ist es möglich,
die Datenrate zu reduzieren, indem solche Geräusche, die unter der Mithörschwelle
liegen, aus den Daten entfernt werden. Es werden dabei auch die
verschiedenen Frequenzbereiche unterschiedlich fein quantisiert,
wobei die Feinheit der Quantisierung dadurch bestimmt ist, daß das Quantisierungsrauschen
noch unterhalb der Mithörschwelle
liegt. Aus dieser unterschiedlichen Quantisierung pro Frequenzbereich
ergibt sich, daß unterschiedlich
viele Bits pro Frequenzbereich zuzuweisen sind. Zum Beispiel schwankt
die Bitzuweisung pro Frequenzbereich zwischen 3 und 16 Bit.
-
In dem nächsten Feld 9 wird
eine Referenzwerteauswahl getroffen. Es kommt durchaus vor, daß Referenzwerte
für mehrere
Gruppen von zeitlich aufeinanderfolgenden Abtastwerten gelten, wobei
die Referenzwerte gleiche oder zumindest sehr ähnliche Signalleistungswerte
aufweisen. Dies wurde bereits oben dargelegt. Daher ist es nicht
notwendig, für
jeden Frequenzbereich mehrere Referenzwerte zu übertragen, wenn ein Referenzwert
mehrere Gruppen repräsentiert.
In diesem Feld 9 ist nun beschrieben, welche Referenzwerte
für welche
Gruppen von Abtastwerten zur Denormierung zu verwenden sind.
-
Im Feld 10 sind dann die
Referenzwerte selbst abgespeichert. Im Feld 11 sind die
eigentlichen Audiodaten, die mit den Referenzwerten denormiert werden,
abgelegt. Im Feld 12 befinden sich Zusatzdaten, die programmbegleitende Informationen
umfassen und vor allem die Prüfsumme
für die
Referenzwerte des folgenden Rahmens.
-
Alternativ kann vorgesehen sein,
daß ein Zähler als
Maß der Übertragungsqualität pro Fehler eines
Rahmens inkrementiert und pro fehlerfreiem Rahmen dekrementiert
wird. Wird dieser Zähler
mit Schwellwerten verglichen, kann damit abgeschätzt werden, ob nur kurzfristige
Störungen
auftreten oder diese häufiger
vorkommen. Es wird also eine Gedächtnisfunktion
implementiert, die die Geschichte der zeitlichen Fehlerhäufigkeit
berücksichtigt.
Tritt kurzfristig eine Störung
auf, so wird anhand des Zählers
ein nur geringer Fehlerstand ermittelt und auf Fehlerverschleierungsmaßnahmen
kann verzichtet werden. Das Verfahren zeigt damit vorteilhafterweise eine
Trägheit,
das aufgrund vereinzelter Fehler nicht zu Fehlerverschleierungsmaßnahmen
greift. Steigt jedoch der Zähler
stetig, müssen
Fehlerverschleierungsmaßnahmen
eingesetzt werden, im Extremfall sogar eine Stammschaltung, da die
Fehlerrate zu groß wird,
um die Fehler sinnvoll zu verschleiern. Werden Fehlerverschleierungsverfahren
eingesetzt, werden die oben beschriebenen Entzerrerwerte bestimmt,
um insbesondere höhere
Frequenzbereiche zu bedämpfen.
-
Alternativ können auch zwei Zähler verwendet
werden, die nach einem optimalen Empfang wieder zurückgesetzt
werden.
-
Referenzwerte können auch in Gruppen zusammengefaßt werden,
wobei dann, wenn ein Fehler in einem Referenzwert erkannt wird,
die ganze Gruppe durch abgespeicherte Referenzwerte ersetzt wird. Dies
führt zu
einer Aufwandsersparnis.