-
Die
vorliegende Erfindung bezieht sich auf die Audio-Kompression und
insbesondere auf die Decodierung und Wieder-Codierung von komprimierten
Audio-Signalen.
-
Die
frühere
internationale Anmeldung WO-A-98/33284 von British Broadcasting
Corporation, auf die hiermit verwiesen wird, offenbart ein Verfahren
zum Decodieren und Wieder-Codieren eines digitalen Audio-Signals,
das durch Übermittlung
eines Hilfssignals, das Codierungsentscheidungen betreffende Informationen
enthält,
zu einer geringeren Qualitätsbeeinträchtigung
führt.
-
Es
kann jedoch das Problem entstehen, dass das decodierte Audio so
verarbeitet worden ist, dass die Zusatzinformation beim Wieder-Codierungsprozess
nicht mehr hilfreich ist. Unsere frühere Anmeldung schlägt vor,
entweder das Hilfsdaten-Signal
im Fall einer solchen Verarbeitung unwirksam zu machen oder dem
decodierten Audio ein Anzeige-Signal hinzuzufügen, um anzugeben, dass eine
solche Verarbeitung stattgefunden hat.
-
Obwohl
das oben genannte System gut funktioniert, wurde festgestellt, dass
eine alternative Anordnung unter gewissen Umständen bessere Ergebnisse bieten
kann.
-
Aspekte
der Erfindung sind in den Ansprüchen
1, 8, 14, 15 und 16 dargelegt.
-
In
dieser Weise kann, anstatt ein Anzeige-Signal in dem decodierten
Audio identifizieren zu müssen,
durch Vergleich der Signatur-Information mit dem decodierten Audio
zum Zeitpunkt des Wieder-Codierens eine Veränderung des decodierten Audio
detektiert werden. Vorzugsweise wird die Signatur-Information mit
dem Hilfsdaten-Strom übermittelt.
Da der Hilfsdaten-Strom in jedem Fall gelesen werden muss, um darauf
basierend eine Wieder-Codierung auszuführen, kann dies die Verarbeitung
vereinfachen.
-
Es
sei angemerkt, dass die Signatur-Information, die eine von den Werten
der decodierten Audio-Proben erhaltene Prüfsumme enthält, eine Identifikation selbst
kleinerer Veränderungen
ermöglicht und
die Bewahrung absoluter Reinheit des Audio-Signals zulässt.
-
In
Ausführungsformen
kann die Signatur-Information eine von dem decodierten Audio-Signal
erhaltene statistische Information, beispielsweise einen Mittelwert-Signalpegel und optional
eine Standardabweichung von Proben-Werten von dem Mittelwert, enthalten.
Dies kann das Detektieren signifikanter Veränderungen des Audio-Signals
ermöglichen, während das
System gegenüber
geringfügigen
Veränderungen
unempfindlich gemacht wird. So kann die Signatur-Information eine
Information enthalten, die es ermöglicht, signifikante Veränderungen
des Audio-Signals
zu detektieren, jedoch kleinere Veränderungen zu ignorieren. Ähnlich kann
es die Signatur-Information ermöglichen,
eine Übereinstimmung oder
eine teilweise Übereinstimmung
zu detektieren, wenn das decodierte Audio-Signal einer kleineren Veränderung
unterzogen wurde.
-
Das
Verfahren kann ferner das Ermitteln, ob die Signatur-Information
zu dem decodierten Audio passt, beispielsweise durch Vergleichen
einer von den decodierten Audio-Signalen erhaltenen Signatur mit
der übermittelten
Signatur-Information, und das Ermitteln, ob die Differenz zwischen
der abgeleiteten und der übermittelten
Signatur einen vorgegebenen Grenzwert übersteigt, umfassen. Wenn die
Signatur passt, können
die decodierten Signale unter Verwendung des Hilfssignals, beispielsweise
in der in unserer früheren
Anmeldung WO-A-98/33284 beschriebenen Weise, wiedercodiert werden.
Wenn die Signatur nicht passt, kann das decodierte Signal ohne Verwendung
des Hilfsdaten-Signals oder unter Verwendung nur eines Teils des
Hilfsdaten-Signals wiedercodiert werden.
-
Das
Hilfssignal kann gemeinsam mit der Signatur-Information von einem
empfangenen kompressionscodierten Audio-Signal als Teil der Kompressionsdecodierung
des kompressionscodierten Audio-Signals abgeleitet werden.
-
Das
Hilfsdaten-Signal kann aus den Signalen gewählt sein, die in unserer früheren Anmeldung WO-A-98/33284
beschrieben sind.
-
Weitere
bevorzugte Merkmale sind in den Ansprüchen angeführt, auf die verwiesen sein
soll.
-
Im
Folgenden wird beispielhalber eine Ausführungsform der Erfindung beschrieben,
wobei Bezug auf die begleitende Zeichnung genommen wird, in der 1 eine schematische Darstellung
eines hintereinandergeschalteten Decodierungs- und Wieder-Codierungsprozesses gemäß einer
bevorzugten Ausführungsform
ist.
-
Wie
in 1 gezeigt ist, wird
ein komprimiertes Audio-Signal zu einem Decodierer 10 geleitet,
der eine Hilfsinformation zum Gebrauch bei der Wieder-Codierung
des Signals entnimmt und das Signal dekomprimiert, um ein decodiertes
Audio-Signal und ein Hilfssignal zu erzeugen. In der gezeigten Ausführungsform
werden das decodierte Audio-Signal und das Hilfssignal getrennt
ausgegeben. Das decodierte Audio-Signal geht durch die Studioeinrichtung,
die das Signal verarbeiten kann, und wird in einem Codierer 20 erneut
codiert. Das entnommene Hilfssignal wird für den Gebrauch bei der Wieder-Codierung
zu dem Codierer 20 geleitet.
-
So
weit kann die Vorrichtung verwendet werden, die in unserer früheren WO-A-98/33284
beschrieben ist, wobei auf die gesamte Offenbarung unter speziellem
Bezug auf 2 und die zugehörige Beschreibung
verwiesen sein soll.
-
In
der gezeigten Ausführungsform
wird das Hilfssignal von dem decodierten Audio-Signal getrennt übermittelt.
Als Alternative, wie sie beispielsweise in WO-A-98/33284 beschrieben
ist, kann das Hilfssignal mit dem decodierten Audio-Signal übermittelt
werden; eine Anordnung, die geeignet ist, um dies zu vollziehen,
ist mit Bezug auf 3 der WO-A-98/33284
beschrieben.
-
In Übereinstimmung
mit der vorliegenden Erfindung wird zusätzlich zu der Hilfsinformation
zum Gebrauch bei der Wieder-Codierung die Signatur-Information,
die für
das decodierte Audio-Signal kennzeichnend ist, von dem Decodierer 10 berechnet
und als Teil des Hilfsdaten-Signals übermittelt.
-
Die
Signatur-Information kann beispielsweise eine für einzelne Audio-Proben oder
für eine
vorgegebene Anzahl von Audio-Proben berechnete Prüfsumme umfassen.
Das Vorsehen einer Prüfsumme
ermöglicht
eine genaue Überprüfung einer
naturgetreuen Wiedergabe des Audio-Signals. Alternativ kann die
Signatur-Information ein von dem decodierten Audio-Signal abgeleitetes
Maß, beispielsweise ein
statistisches Maß wie
etwa der mittlere Signalpegel und optional die Standardabweichung
(oder ein anderes Maß wie
etwa die Varianz oder dergleichen) von Proben von dem Mittelwert,
enthalten. Das Vorsehen einer statistischen oder einer anderen Information
kann es ermöglichen,
kleinere Veränderungen
(worunter Veränderungen
verstanden werden, bei denen es nicht wahrscheinlich ist, dass sie
das Codieren wesentlich beeinflussen) zu tolerieren, während Gebrauch
von einer vorherigen Codierinformation gemacht wird. Es kann vorgesehen
sein, eine teilweise Übereinstimmung,
die einer Übereinstimmung
nahe kommt, zu identifizieren, damit ein Teil der Information oder
die gesamte Information verwendet werden kann.
-
Das
Hilfssignal und das Signatur-Signal werden vorzugsweise gemeinsam
als ein einziges digitales Datensignal befördert. Sie können vorteilhaft
in den Anwenderbits eines AES-3-Bitstroms transportiert werden.
-
In
dem Codierer 20 wird die empfangene Signatur-Information
mit einer weiteren Signatur, die aus dem decodierten Audio-Signal,
das von der Studioeinrichtung verarbeitet worden ist, berechnet
wird, verglichen. Wenn die Signaturen mit einem vorgegebenen Grenzwert übereinstimmen,
wird das Codieren unter Verwendung der Hilfsinformation, beispielsweise
in der in WO-A-98/33284 beschriebenen Weise, ausgeführt.
-
Wenn
die Signaturen nicht übereinstimmen, wird
die Wieder-Codierung ohne Bezugnahme auf das Hilfssignal ausgeführt.
-
Das
Festlegen des Grenzwertes, an dem eine Übereinstimmung erfasst wird,
hängt von
der Art des Hilfssignals und außerdem
von der Art der Signatur-Information ab. Der Grenzwert sollte so
festgelegt sein, dass die Hilfsinformation stets dann verwendet wird,
wenn sie den Wieder-Codierungsprozess unterstützen kann, jedoch verworfen
wird, wenn sie die Wiedergabetreue des gesamten hintereinandergeschalteten
Decodierungs- und Wieder-Codierungsprozesses nicht erhöht.
-
In
bestimmten Fällen
kann der Wieder-Codierungsprozess anstelle eines "Ja/Nein"-Vergleichs so ausgebildet
sein, dass er einen Teil, jedoch nicht die gesamte Hilfsinformation
berücksichtigt
oder basierend auf der Hilfsinformation einen "blinden" Wieder-Codierungsprozess modifiziert,
wenn eine unvollkommene Signaturübereinstimmung
erfasst wird, jedoch die Hilfsinformation nicht insgesamt verwirft.
-
Als
Hintergrund werden nun bestimmte Beispiele einer Hilfsinformation
und Möglichkeiten,
diese auszuführen,
(wie sie in WO-A-98/33284 beschrieben sind) zusammengefasst.
-
Beispiele
von Signalen, welche die Hilfsdaten enthalten können, sind:
- 1.
Das codierte Audio-Signal am Eingang des Decodierers (D1, D2 usw.).
Dieses enthält
nicht nur audiobezogene Daten und das PTS, sondern auch bestimmte
Hilfsinformationen wie etwa dem Programm zugeordnete Daten (PAD),
die gegebenenfalls bei der Ausgabe aus dem Studiobereich in das
codierte Signal kopiert werden müssen,
und einen Fehlerschutz. Je nach Umständen, würde ein solches Signal den
Codierer (C) in die Lage versetzen, das ursprüngliche codierte PCM-Signal
durch das erneut codierte Signal zu ersetzen oder das PCM-Signal
mit Blöcken
von Audio-Daten, die den Blöcken
innerhalb des ursprünglichen
codierten Signals sehr ähnlich
erscheinen, erneut zu codieren, wie oben beschrieben worden ist.
Das Befördern
des codierten Audio-Signals zu dem Codierer liefert den weitesten Bereich
von Optionen für
die Wieder-Codierung bei minimaler zusätzlicher Beeinträchtigung
des Audios.
- 2. Die codierten Audio-Proben am Eingang zu dem Decodierer abzüglich der
quantisierten Audio-Proben (die identisch aus dem PCM-Audio-Signal
neu erzeugt werden können).
Dies ist ein Signal, in dem die Positionen der Rahmengrenzen des
ursprünglichen
codierten Signals in Bezug auf die linearen Audio-Proben in dem
PCM-Signal angegeben sind und aus dem die Positionen der Datenblöcke innerhalb
der Rahmen gemeinsam mit Informationen über die Zuweisung von Bits
an die verschiedenen Komponenten des codierten Signals (auch als "Bit-Zuweisungsdaten" bekannt), Skalierungsfaktoren,
Blocklängen
(in Codierverfahren, bei denen dies relevant ist), dem PTS und weiteren
Daten, die für
das verwendete Codiersystem relevant sind, abgeleitet werden können.
- 3. Ein Signal, das dem in "2" oben beschriebenen Signal
gleicht, jedoch eine Untermenge der beschriebenen Informationen
(z. B. nur die Positionen der Rahmengrenzen) enthält.
-
Wie
oben erwähnt
worden ist, wird die Signatur-Information vorzugsweise in den Hilfsdaten
mitgeführt.
Sie kann jedoch unabhängig,
beispielsweise in einem eigens zugewiesenen Kanal, befördert werden.
-
Das
Folgende sind Wege, auf denen das Hilfsdaten-Signal gemeinsam mit
dem PCM-Audio transportiert werden könnte. Die Signatur-Information,
falls sie nicht mit dem Hilfsdaten-Signal kombiniert ist, kann auf
dem einen oder dem anderen dieser möglichen Wegen transportiert
werden. Diese Wege sind:
- 1. In den Hilfsprobenbits
des Bitstroms gemäß der Empfehlung
ITU-R 647. Bei der Studio-Standardabtastfrequenz von 48 kHz ist
in den Hilfsprobenbits sowohl der "X"-
als auch der "Y"-Unterrahmen eine
Gesamtbitrate von 384 kbit/s verfügbar. Dieses Verfahren ist
zum Befördern
der Hilfsdaten zwischen verschiedenen Einrichtungsgegenständen ideal,
jedoch besteht die Art und Weise, in der eine Studioeinrichtung
diese Hilfsprobenbits verarbeiten könnte, betreffend eine gewisse
Unbestimmtheit. Beispielsweise kann es sein, dass die Studioeinrichtung
diese Bits nicht mit dem PCM-Audio zum Ausgang durchleitet oder
diese Bits nicht um denselben Betrag wie das PCM-Audio verzögert. In
jedem Fall kann eine gewisse Modifikation der Studioeinrichtung
oder deren Umgebung erforderlich sein.
- 2. In den niedrigstwertigen Bits (LSB) der PCM-Audio-Probenworte
des Bitstroms gemäß der Empfehlung
ITU-R 647. Die Bits können
in das aktive Audio eingefügt
oder zusätzliche
Bits sein. Abhängig
von dem Auflösungsvermögen der Studioeinrichtung
können
diese dieselben wie die Hilfsprobenbits (diese sind die LSB, falls
das Signal nach der Empfehlung 647 so konfiguriert ist, dass es
24-Bit-Audio-Probenworte trägt)
oder die niedrigstwertigen Bits innerhalb des Abschnitts des Unterrahmens,
der für
die 20-Bit Audio-Probenworte
(dies sind dieselben Bits, die die 20 höchstwertigen Bits der 24-Bit-Probenworte tragen)
reserviert sind, sein. Die Daten können als niedrigstwertiges
Bit eines 16-Bit-Audios mitgeführt
werden. Das Mitführen
der Hilfsdaten in dem LSB der Audio-Probenworte beseitigt die Probleme
der Weiterleitung innerhalb der Studioeinrichtung, wobei Sorgfalt
darauf gelegt wird, sicherzustellen, dass das Hilfsdaten-Signal
unhörbar
ist. Die Studioeinrichtung muss für Audio-Probenworte von wenigstens
20 Bits durchlässig
sein. Falls erforderlich sollte die Hörbarkeit des Hilfsdaten-Signals
durch Verwürfelung
(z. B. die Modulo-2-Hinzufügung
einer pseudozufälligen
Binärfolge
oder die Verwendung eines selbstsynchronisierenden Verwürflers)
verringert werden. Alternativ könnte
sie insgesamt durch Abschneiden der Probenworte auf die geeignete
Länge (d.
h. durch Ausschließen
der Hilfsdaten) beseitigt werden.
- 3. In den Anwenderdatenbits des Bitstroms gemäß der Empfehlung
ITU-R 647. Indem die Anwenderdatenbits sowohl aus den "X"- als auch aus den "Y"-Unterrahmen
genommen werden, wird ein Kanal mit einer Bitrate von nur 96 kbit/s bereitgestellt.
In vielen Anwendungen scheint dies nicht ausreichend zu sein, um
das vollständige codierte
Audio-Signal zu transportieren. Es würde ausreichen, um die Positionen
der Rahmengrenzen zu signalisieren und einige weitere, dem codierten
Audio entnommene Informationen zu befördern. Bei diesem Verfahren
besteht eine Unbestimmtheit hinsichtlich der Art und Weise, in der die
Studioeinrichtung die Anwenderdaten verarbeitet.
- 4. In dem oberen Teil des Audio-Spektrums bei Frequenzen, die
höher als
jene der hörbaren Komponenten
des Signals sind. Zu diesem Zweck würde das PCM-Audio-Signal durch
einen Tiefpass gefiltert und das codierte Hilfsdaten-Signal oberhalb
des von dem hörbaren
Signal belegten Durchlassbereiches hinzugefügt. Eine besonders raffinierte
Art und Weise, dies zu tun, wenn der Studiobereich MPEG-Audio-codierte
Signale empfängt,
wäre die
Verwendung einer MPEG-Analyse-Unterband-Filterbank, wobei sich die
gegenseitige Synthese-Filterbank an den Einfügungseinheiten befände. Bei
einer 48-kHz-Abtastfrequenz reicht der Audio-Durchlassbereich fast
bis 24 kHz. Bei der MPEG-Audio-Codierung ist dieser Durchlassbereich
in 32 gleich beabstandete Unterbänder
unterteilt, wovon jedes eine Bandbreite von 750 Hz besitzt. Die
oberen fünf Unterbänder werden
nicht benutzt, wobei das Audio somit durch ein Tiefpassfilter wirksam
auf 20,25 kHz gefiltert wird. Die Hilfsdaten könnten in die oberen Unterbänder eingefügt werden
und würden
in dem oberen Teil des Spektrums des PCM-Audio-Signals geführt, um
durch eine weitere MPEG-Analyse-Filterbank an dem Verteiler extrahiert
zu werden. Das an den Codierer angelegte PCM-Signal müsste nicht
weiter gefiltert werden, um die Hilfsdaten zu entfernen, wie dies
in der Analyse-Filterbank in dem Codierer selbst geschähe.
- 5. Das Hilfssignal könnte
eine bekannte pseudozufällige
Tiefpegel-Binärfolge
sein, die dem Audio hinzugefügt
würde.
Die pseudozufällige
Binärfolge
würde auf
irgendeine Weise auf die Audio-Rahmengrenzen synchronisiert und
könnte, wo
es möglich
ist, mit zusätzlichen
Daten moduliert werden. Die pseudozufällige Binärfolge könnte auch vor der endgültigen Übertragung
oder Überwachung
von den Daten subtrahiert werden.
-
Es
ist erläutert
worden, dass es unter bestimmten Umständen zweckmäßig ist, eine teilweise Decodierung
und Wieder-Codierung vorzunehmen. In den beigefügten Ansprüchen sollten die Begriffe "Decodierung" und "Wieder-Codierung" so verstanden werden,
dass sie eine teilweise Decodierung bzw. Wieder-Codierung umfassen.
-
Selbstverständlich gibt
es viele Möglichkeiten,
die Erfindung so anzuwenden, dass sie die Wieder-Codierung eines
zuvor decodierten Signals unterstützt. Insbesondere sei angemerkt,
dass die vorliegende Erfindung nicht speziell auf einen grundlegenden
Decodierungs- und Wieder-Codierungsprozess begrenzt ist, wie er
in WO-A-98/33284 beschrieben ist, deren Offenbarung lediglich als
exemplarisches System, in dem die Erfindung angewandt werden kann,
angegeben worden ist.
-
Jedes
hier offenbarte Merkmal kann, sofern nichts anderes angegeben worden
ist, unabhängig vorgesehen
sein.