Nachteilig
an DVDs ist jedoch die Tatsache, daß für sie eigene DVD-Spieler benötigt werden,
und daß also
herkömmliche
Audio-CD-Abspielgeräte nicht
dazu verwendet werden können,
DVDs abzuspielen. Darüber
hinaus existiert ferner keine Möglichkeit,
solche normalen Audio-CD-Spieler mit einfachen Maßnahmen „upzugraden", so daß sie in
der Lage wären,
nicht nur Audio-CDs abzuspielen, sondern auch DVDs.
Dies
ist insbesondere bedauerlich, da eine große Anzahl von CD-Spielern im
Umlauf ist, mit denen keine Multikanal-Wiedergabe erreichbar ist. Andererseits
scheuen jedoch viele Kunden davor zurück, den komplett funktionsfähigen CD-Player, mit dem sie
vertraut und rundum zufrieden sind, „auszumustern", um nunmehr nur
noch auf DVDs umzusteigen, obgleich die Kunden vielleicht an den
auf den DVDs typischerweise enthaltenen Videoinformationen überhaupt
nicht interessiert sind, sondern nur einfach einen guten 5-Kanal-Sound haben wollen.
Auch über das
Internet oder von anderen Quellen enthaltene codierte Multikanaldarstellungen könnten zwar
auf CDs gebrannt werden, wenn keine Lizenzrechte im Wege stehen.
Doch auch solche gebrannten CDs sind nicht mit normalen CD-Playern kompatibel,
da sie codierte Informationen enthal ten, während die auf den Audio-CDs
enthaltenen Stereodaten lediglich un-komprimierte 16-Bit-PCM-Daten sind,
die lediglich einer Fehlerschutzcodierung unterzogen sind, die zu
einer Erhöhung
der Datenrate führt,
und keiner Datenkomprimierung unterzogen sind, die zu einer Reduktion
der Datenrate führen würde.
So
existieren in der Technik viele Techniken zum Reduzieren der Datenmenge,
die zur Übertragung
eines Multikanal-Audiosignals
benötigt
wird. Solche Techniken werden Joint-Stereo-Techniken genannt. Zu diesem
Zweck wird auf 3 verwiesen, die eine Joint-Stereo-Vorrichtung 60 zeigt.
Diese Vorrichtung kann eine Vorrichtung sein, die beispielsweise
die Intensity-Stereo- (IS-) Technik oder die Binaural Cue Codiertechnik
(BCC) implementiert. Ein solches Gerät empfängt üblicherweise als Eingangssignal
zumindest zwei Kanäle
CH1, CH2, .... CHn, und gibt einen einzigen Trägerkanal sowie parametrische Multikanalinformationen
aus. Die parametrischen Daten sind so definiert, daß in einem
Decodierer eine Approximation eines Ursprungskanals (CH1, CH2, ...,
CHn) berechnet werden kann.
Normalerweise
wird der Trägerkanal
Subband-Abtastwerte, Spektralkoeffizienten, Zeitbereichsabtastwerte
etc. umfassen, die eine relativ feine Darstellung des zugrundeliegenden
Signals liefern, während
die parametrischen Daten keine solchen Abtastwerte oder Spektralkoeffizienten
umfassen, sondern Steuerparameter zum Steuern eines bestimmten Rekonstruktionsalgorithmus,
wie beispielsweise Gewichten durch Multiplizieren, durch Zeitverschieben,
durch Frequenzverschieben, etc. Die parametrischen Multikanalinformationen
umfassen daher eine relativ grobe Darstellung des Signals oder des
zugeordneten Kanals. In Zahlen ausgedrückt beträgt die Menge an Daten, die
von einem Trägerkanal
benötigt
wird, eine Menge von etwa 60 bis 70 kBit/s, während die Menge an Daten, die
durch parametrische Seiteninformationen für einen Kanal benötigt wird,
im Bereich von 1, 5 bis 2, 5 kBit/s ist. Es sei darauf hingewiesen,
daß die
vorstehenden Zahlen für
komprimierte Daten gelten. Selbstverständlich benötigt ein nicht-komprimierter
CD-Kanal Datenraten im Bereich von etwa dem Zehnfachen. Ein Beispiel
für parametrische
Daten sind die bekannten Skalenfaktoren, Intensity-Stereo-Informationen
oder BCC-Parameter, wie es nachfolgend dargelegt wird.
Die
Technik der Intensity-Stereo-Codierung ist in dem AES-Preprint 3799, „Intensity
Stereo Coding",
J. Herre, K.H. Brandenburg, D. Lederer, Februar 1994, Amsterdam
beschrieben. Allgemein basiert das Konzept von Intensity Stereo
auf einer Hauptachsentransformation, die auf Daten beider stereophoner
Audiokanäle
durchzuführen
ist. Wenn die meisten Datenpunkte um die erste Hauptachse herum
konzentriert sind, kann ein Codiergewinn erreicht werden, indem
beide Signale um einen bestimmten Winkel gedreht werden, bevor die
Codierung stattfindet. Dies ist jedoch nicht immer für reale
stereophone Reproduktionstechniken gegeben. Daher wird diese Technik
dahingehend modifiziert, daß die
zweite orthogonale Komponente von der Übertragung in dem Bitstrom
ausgeschlossen wird. Somit bestehen die rekonstruierten Signale
für den
linken und den rechten Kanal aus unterschiedlich gewichteten oder
skalierten Versionen desselben übertragenen
Signals. Dennoch unterscheiden sich die rekonstruierten Signale
in ihrer Amplitude, sie sind jedoch identisch im Hinblick auf ihre
Phaseninformationen. Die Energie-Zeit-Hüllkurven beider ursprünglicher
Audiokanäle
werden jedoch durch die selektive Skalierungsoperation bei behalten,
die typischerweise auf frequenzselektive Art und Weise arbeitet.
Dies entspricht der menschlichen Wahrnehmung des Schalls bei hohen Frequenzen,
wo die dominanten räumlichen
Informationen durch die Energiehüllkurven
bestimmt werden.
Zusätzlich wird
bei praktischen Implementierungen das übertragene Signal, d. h. der
Trägerkanal aus
dem Summensignal des linken Kanals und des rechten Kanals anstatt
der Rotation beider Komponenten erzeugt. Ferner wird diese Verarbeitung,
d. h. das Erzeugen von Intensity-Stereo-Parametern zum Durchführen der
Skalierungsoperationen frequenzselektiv durchgeführt, d. h. unabhängig für jedes
Skalenfaktorband, d. h. für
jede Codiererfrequenzpartition. Vorzugsweise werden beide Kanäle kombiniert, um
einen kombinierten oder „Träger"-Kanal und zusätzlich zu
dem kombinierten Kanal die Intensity-Stereo-Informationen zu bilden.
Die Intensity-Stereo-Informationen
hängen
von der Energie des ersten Kanals, der Energie des zweiten Kanals
oder der Energie des kombinierten Kanals ab.
Die
BCC-Technik ist in dem AES-Convention-Paper 5574 „Binaural
Cue Coding applied to stereo and multichannel audio compression", T. Faller, F. Baumgarte,
Mai 2002, München,
beschrieben. Bei der BCC-Codierung wird eine Anzahl von Audioeingangskanälen in eine
Spektraldarstellung umgewandelt, und zwar unter Verwendung einer
DFT-basierten Transformation mit überlappenden Fenstern. Das
resultierende Spektrum wird in nicht-überlappende Abschnitte eingeteilt,
von denen jeder einen Index hat. Jede Partition hat eine Bandbreite
proportional zu der äquivalenten
Rechteckbandbreite (ERB). Die Inter-Kanal-Pegelunterschiede (ICLD;
ICLD = Inter Channel Level Differences) und die Interkanal-Zeitunterschiede (ICTD;
ICTD = Inter Channel Time Differences) werden für jede Partition und für jeden
Frame k ermittelt. Die ICLD und ICTD werden quantisiert und codiert,
um schließlich
als Seiteninformationen in einen BCC-Bitstrom zu kommen. Die Interkanal-Pegelunterschiede
und die Interkanal-Zeitunterschiede sind
für jeden
Kanal relativ zu einem Referenzkanal gegeben. Dann werden die Parameter
gemäß vorbestimmter
Formeln berechnet, die von den bestimmten Partitionen des zu verarbeitenden
Signals abhängen.
Auf
Decodiererseite empfängt
der Decodierer typischerweise ein Monosignal und den BCC-Bitstrom.
Das Monosignal wird in den Frequenzbereich transformiert und in
einen Raumsyntheseblock (Spatial-Syntheseblock) eingegeben, der
auch decodierte ICLD- und ICTD-Werte empfängt. In dem Spatial-Syntheseblock werden
die BCC-Parameter (ICLD und ICTD) verwendet, um eine Gewichtungsoperation
des Monosignals durchzuführen,
um die Multikanalsignale zu synthetisieren, die, nach einer Frequenz-/Zeit-Umwandlung
eine Rekonstruktion des ursprünglichen
Multikanal-Audiosignals darstellen.
Im
Fall von BCC ist das Joint-Stereo-Modul 60 wirksam, um die kanalseitigen
Informationen so auszugeben, daß die
parametrischen Kanaldaten quantisierte und codierte ICLD- oder ICTD-Parameter
sind, wobei einer der ursprünglichen
Kanäle
als Referenzkanal zum Codieren der Kanalseiteninformationen verwendet
wird.
Normalerweise
wird der Trägersignal
aus der Summe der teilnehmenden Ursprungskanäle gebildet.
Natürlich liefern
die obigen Techniken nur eine Monodarstellung für einen Decodierer, der nur den
Trägerkanal
ver arbeiten kann, der jedoch nicht in der Lage ist, die parametrischen
Daten zur Erzeugung von einer oder mehreren Approximationen von mehr
als einem Eingangskanal zu verarbeiten.
Die
BCC-Technik ist auch in den US-Patentveröffentlichungen US 2003/0219130
A1, US 2003/0026441 A1 und US 2003/0035553 A1 beschrieben. Zusätzlich wird
auf die Fachveröffentlichung „Binaural
Cue Coding. Part II: Schemes and Applications", T. Faller und F. Baumgarte, IEEE Trans.
On Audio and Speech Proc. Bd. 11, Nr. 6, November 2003 verwiesen.
Nachfolgend
wird ein typisches BCC-Schema zur Multikanalaudiocodierung detaillierter
dargestellt, und zwar Bezug nehmend auf die 4 bis 6.
5 zeigt
ein solches BCC-Schema zur Codierung/Übertragung von Multikanalaudiosignalen.
Das Multikanalaudioeingangssignal an einem Eingang 110 eines
BCC-Codierers 112 wird
in einem sogenannten Downmix-Block 114 heruntergemischt. Bei
diesem Beispiel ist das ursprüngliche
Multikanalsignal an dem Eingang 110 ein 5-Kanal-Surround-Signal mit einem
vorderen linken Kanal, einem vorderen rechten Kanal, einem linken
Surround-Kanal, einem rechten Surround-Kanal und einem Mittenkanal. Bei
dem bevorzugten Ausführungsbeispiel
der vorliegenden Erfindung erzeugt der Downmix-Block 114 ein
Summensignal durch eine einfache Addition dieser fünf Kanäle in ein
Monosignal.
Andere
Downmixing-Schemen sind in der Technik bekannt, so daß unter
Verwendung eines Multikanal-Eingangssignals ein Downmix-Kanal mit einem
einzigen Kanal erhalten wird.
Dieser
einzige Kanal wird an einer Summensignalleitung 115 ausgegeben.
Eine Seiteninformation, die von dem BCC-Analyseblock 116 erhalten wird,
wird auf einer Seiteninformationsleitung 117 ausgegeben.
Bei
dem BCC-Analyseblock werden Interkanal-Pegelunterschiede (ICLD) und Interkanal-Zeitunterschiede
(ICTD) berechnet, wie es vorstehend dargestellt worden ist. Neuerdings
ist der BCC-Analyseblock 116 auch in der Lage, Interkanal-Korrelationswerte
(ICC-Werte) zu berechnen. Das Summensignal und die Seiteninformationen
werden in einem quantisierten und codierten Format zu einem BCC-Decodierer 120 übertragen.
Der BCC-Decodierer zerlegt das übertragene
Summensignal in eine Anzahl von Subbändern und führt Skalierungen, Verzögerungen
und andere Verarbeitungsschritte aus, um die Subbänder der
auszugebenden Multikanal-Audiokanäle zu liefern.
Diese Verarbeitung wird so durchgeführt, daß die ICLD-, ICTD- und ICC-Parameter
(Cues) eines rekonstruierten Multikanalsignals am Ausgang 121 mit
den entsprechenden Cues für das
ursprüngliche
Multikanalsignal am Eingang 110 in dem BCC-Codierer 112 übereinstimmen.
Zu diesem Zweck umfaßt
der BCC-Decodierer 120 einen BCC-Syntheseblock 122 und einen
Seiteninformationenüberarbeitungsblock 123.
Nachfolgend
wird der interne Aufbau des BCC-Syntheseblocks 122 Bezug
nehmend auf 6 dargestellt. Das Summensignal
auf der Leitung 115 wird in eine Zeit-/Frequenz-Umwandlungseinheit oder
Filterbank FB 125 eingespeist. Am Ausgang des Blocks 125 existiert
eine Anzahl N von Subbandsignalen oder, in einem Extremfall, ein
Block von Spektralkoeffizienten, wenn die Audio-Filterbank 125 eine 1:1-Transformation durchführt, d.
h. eine Transformation, die N Spektralkoeffizienten aus N Zeitbereichsabtastwerten
erzeugt.
Der
BCC-Syntheseblock 122 umfaßt ferner eine Verzögerungsstufe 126,
eine Pegelmodifikationsstufe 127, eine Korrelationsverarbeitungsstufe 128 und
eine Inversfilterbankstufe IFB 129. Am Ausgang der Stufe 129 kann
das rekonstruierte Multikanalaudiosignal mit beispielsweise fünf Kanälen im Falle
eines 5-Kanal-Surroundsystems zu einem Satz von Lautsprechern 124 ausgegeben
werden, wie sie in 5 oder 4 dargestellt
sind.
Das
Eingangssignal sn wird in den Frequenzbereich oder den Filterbankbereich
mittels des Elements 125 umgewandelt. Das Signal, das vom Element 125 ausgegeben
wird, wird derart kopiert, daß mehrere
Versionen desselben Signals erhalten werden, wie es durch den Kopierknoten 130 dargestellt
ist. Die Anzahl der Versionen des ursprünglichen Signals ist gleich
der Anzahl der Ausgangskanäle
in dem Ausgangssignal. Dann wird jede Version des ursprünglichen
Signals am Knoten 130 einer bestimmten Verzögerung d1, d2, ..., di, ... dN unterzogen. Die
Verzögerungsparameter
werden durch den Seiteninformationsverarbeitungsblock 123 in 5 berechnet
und von den Interkanal-Zeitunterschieden, wie sie durch den BCC-Analyseblock 116 von 5 berechnet
worden sind, abgeleitet.
Dasselbe
gilt für
die Multiplikationsparameter a1, a2, ..., ai, ...,
aN, die ebenfalls durch den Seiteninformationsverarbeitungsblock 123 basierend
auf den Interkanal-Pegelunterschieden,
wie sie durch den BCC-Analyseblock 116 berechnet worden
sind, berechnet werden.
Die
durch den BCC-Analyseblock 116 berechneten ICC-Parameter werden
zum Steuern der Funktionalität
des Blocks 128 verwendet, so daß bestimmte Korrelationen zwischen
den verzögerten
und in ihren Pegeln manipulierten Signalen an den Ausgängen des
Blocks 128 erhalten werden. Es sei hier darauf hingewiesen,
daß die
Reihenfolge der Stufen 126, 127, 128 von
der in 6 gezeigten Reihenfolge abweichen kann.
Es
sei darauf hingewiesen, daß bei
einer rahmenweisen Verarbeitung des Audiosignals auch die BCC-Analyse
rahmenweise durchgeführt
wird, also zeitlich variabel, und daß ferner eine frequenzweise BCC-Analyse
erhalten wird, wie es durch die Filterbank-Aufteilung aus 6 ersichtlich
ist. Dies bedeutet, daß die
BCC-Parameter für
jedes Spektralband erhalten werden. Dies bedeutet ferner, daß in dem
Fall, in dem die Audiofilterbank 125 das Eingangssignal
in beispielsweise 32 Bandpaßsignale zerlegt,
der BCC-Analyseblock einen Satz von BCC-Parametern für jedes
der 32 Bänder
erhält.
Natürlich
führt der
BCC-Syntheseblock 122 von 5, der detailliert
in 6 dargestellt ist, eine Rekonstruktion durch,
die auch auf den beispielhaft genannten 32 Bändern basiert.
Nachfolgend
wird Bezug nehmend auf 4 ein Szenario dargestellt,
das dazu verwendet wird, um einzelne BCC-Parameter zu bestimmen. Normalerweise
können
die ICLD-, ICTD- und ICC-Parameter zwischen Kanalpaaren definiert
werden. Es wird jedoch bevorzugt, die ICLD- und ICTD-Parameter zwischen
einem Referenzkanal und jedem anderen Kanal zu bestimmen. Dies ist
in 4A dargestellt.
ICC-Parameter
können
auf verschiedene Arten und Weisen definiert werden. Allgemein gesagt kann
man ICC-Parameter in dem Codierer zwischen allen möglichen
Kanalpaaren bestimmen, wie es in 4B dargestellt
ist. Es wurde jedoch vorgeschlagen, nur ICC-Parameter zwischen den
stärksten
zwei Kanälen
zu einem Zeitpunkt zu berechnen, wie es in 4C dargestellt
ist, wo ein Beispiel gezeigt ist, bei dem zu einem Zeitpunkt ein
ICC-Parameter zwischen den Kanälen
1 und 2 berechnet wird, und zu einem anderen Zeitpunkt ein ICC-Parameter
zwischen den Kanälen
1 und 5 berechnet wird. Der Decodierer synthetisiert dann die Interkanalkorrelation zwischen
den stärksten
Kanälen
in dem Decoder und verwendet bestimmte heuristische Regeln zum Berechnen
und Synthetisieren der Interkanalkohärenz für die restlichen Kanalpaare.
Bezüglich der
Berechnung beispielsweise der Multiplikationsparameter a1, aN basierend auf
den übertragenen
ICLD-Parametern
wird auf das AES-Convention-Paper Nr. 5574 Bezug genommen. Die ICLD-Parameter
stellen eine Energieverteilung eines ursprünglichen Mehrkanalsignals dar.
Ohne Verlust der Allgemeinheit wird es bevorzugt, wie es in 4A gezeigt, vier ICLD-Parameter zu nehmen,
die die Energiedifferenz zwischen den jeweiligen Kanälen und
dem vorderen linken Kanal darstellen. In dem Seiteninformationsverarbeitungsblock 122 werden die
Multiplikationsparameter a1, ..., aN von den ICLD-Parametern so abgeleitet,
daß die
gesamte Energie aller rekonstruierter Ausgangskanäle dieselbe
ist (oder proportional zu der Energie des übertragenen Summensignals ist).
Um
Multikanalinformationen auf CDs zu bringen, kann außer den
vorgesehenen DVDs auch auf spezielle Audio-CDs zurück gegriffen
werden, die mit Hilfe von Audiocodierverfahren, wie beispielsweise DTS,
die Tonkanäle
in datenreduzierter Form speichern. Diese speziellen Audio-CDs lassen
sich auf normalen Audio-CD-Spielern nicht wiedergeben, sondern erfordern
einen meistens extern an den digitalen Ausgang des normalen Audio-CD-Spieler
anzuschließenden
eigenen Decodierer.
Ferner
existieren Hybrid-SACDs, die mit Hilfe von zwei Schichten auf der
CD sowohl den herkömmlichen
Stereoton zur Wiedergabe auf Audio-CD-Spielern (in der einen Schicht)
als auch den Mehrkanalton im DSC-Format (in der anderen Schicht)
zur Wiedergabe auf SACD-Spielern bieten.
Die
Aufgabe der vorliegenden Erfindung besteht darin, ein flexibles
und eine potentiell hohe Marktakzeptanz erreichendes Konzept zum
Verbreiten und Erzeugen von Multikanal-Audiodaten zu schaffen.
Diese
Aufgabe wird durch eine Vorrichtung zum Beschreiben einer Kompakt-Disk
gemäß Patentanspruch
1, eine Kompakt-Disk
gemäß Patentanspruch
9, eine Vorrichtung zum Abspielen einer Kompakt-Disk nach Patentanspruch
10, ein Verfahren zum Beschreiben einer Kompakt-Disk nach Patentanspruch
12, ein Verfahren zum Abspielen einer Kompakt-Disk nach Patentanspruch
13 oder ein Computer-Programm nach Patentanspruch 14 gelöst.
Der
vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß auf einer üblichen
Audio-CD gemäß dem normalen
CD-Format Subchannels
vorgesehen sind, die gemäß dem CD-Standard definiert sind,
um Metainformationen, wie Daten und Text bzw. ein Videobild zu übertragen.
Erfindungsgemäß werden
diese Subchannels dazu genutzt, um Parameterinformationen mit auf
die normale Stereo-Audio-CD zu schreiben, so daß eine normale Stereo-Audio-CD genug
Informationen für
eine Multikanal-Wiedergabe umfaßt.
Ein
Vorteil dieses Konzepts besteht darin, daß es mit üblichen CD-Playern kompatibel
ist. Übliche
CD-Player liefern dann nach wie vor eine Stereo-Klangdarstellung
der normalen Audio-CD-Stereodaten, die durch das erfindungsgemäße Konzept nicht
beeinflußt
werden. Ist ein CD-Player jedoch erfindungsgemäß ausgestattet, also durch
ein kleines Zusatzmodul, das an dem CD-Player ausgangsseitig die
Stereodaten neben den Sub-Channel-Daten, also den Multikanal-Parameterdaten empfängt und
unter Verwendung des zugrundeliegenden Rekonstruktionsalgorithmus
die Parameterdaten und die Stereodaten miteinander verrechnet, so
wird eine Multikanaldarstellung des ursprünglichen Multikanalsignals geliefert.
Damit
wird erreicht, daß ein
Benutzer seinen normalen CD-Player,
an den er sich gewöhnt
hat, und mit dem er zufrieden ist, behalten kann und zum Lesen der
Multikanal-Audio-CDs
lediglich noch das Zusatzmodul benötigt, das jedoch ohne weiteres
an den CD-Player anschließbar
ist, da jeder CD-Player
einen Stereo-Ausgang hat. Damit muß das Zusatzmodul nicht in
den CD-Player eingreifen, sondern kann einfach an dem ohnehin von
dem CD-Player vorgesehenen Anschluß angesteckt werden. Vorzugsweise
ist dieser Anschluß bzw.
Ausgang des CD-Players ein digitaler Ausgang. Hat ein CD-Player jedoch lediglich einen
analogen Ausgang, was bei ganz alten Modellen der Fall sein kann,
so würde
zusätzlich
noch ein Analog-/Digital-Wandler in dem Zusatz-Mehrkanal-Modul benötigt werden.
Die
vorliegende Erfindung ist ferner dahingehend vorteilhaft, dass bei
einer rückwärtskompatiblen Aufzeichnung
der Mehrkanalinformationen die CD rückwärtskompatibel ist, also genauso
auch auf einem Stereo-CD-Player herkömmlicher Natur abgespielt werden
kann. Die erfindungsgemäße CD kann also
sowohl auf einem normalen CD-Player als auch auf ein Multikanal-erweiterten
CD-Player abgespielt werden.
Alternativ
können
die Mehrkanal-Parameterinformationen auch an anderen Stellen der
Audio-CD untergebracht werden, die nicht von der Zweikanaldarstellung
belegt sind, beispielsweise an einer noch freien Stelle der CD,
auf einer Daten-Partition
einer Hybrid-CD, an einer getrennten Session am Ende der CD etc.
Bevorzugt
wird jedoch, die Parameterdaten bereits auf die Subchannels, die
ohnehin bereits vom normalen Audio-CD-Standard vorgesehen sind, zu „verstecken", da dann keinerlei
Eingriffe in CDs vorgesehen sind, und da die CDs trotz der Tatsache, daß sie nun
Multikanal-Toninformationen haben, dennoch komplett standardgemäß sind und
somit auch keine Probleme in Abspielgeräten verursachen.
Das
erfindungsgemäße Konzept
ist fern dahingehend vorteilhaft, daß durch Darstellung der Multikanalinformation
durch parametrische Multikanal-Daten die Datenmenge ausreichend
komprimiert wird, so daß die
Kanalkapazität
der Subchannels auf der CD ausreichend groß ist. Selbstverständlich wäre es nicht
möglich,
auf diesen Subchannels Nicht-Parameter-Informationen, wie sie auf der DVD zu
finden sind, zu speichern.
Ein
weiterer Vorteil der vorliegenden Erfindung besteht darin, daß bestehende
CD-Beschreibgeräte
verwendet werden können,
da diese ohnehin schon dafür
ausgelegt waren, Daten in die User-Subchannels zu schreiben.
Ferner
können
bereits bestehende CD-Abspielgeräte
verwendet werden, die für
das Lesen von Subchannels ausgelegt sind.
Damit
kann mit minimalem Aufwand auf Seiten des CD-Herstellers, im Hinblick auf die CD
selbst sowie auf Seiten des Benutzers aus einer Stereo-CD eine Multikanal-CD
mit zumindest 3 und vorzugsweise 5, 7 oder noch mehr Kanälen gemacht
werden. Dies alles wird mit der bewährten Audio-CD-Technik erreicht,
die seit Jahren ausgereift, bewährt
und akzeptiert ist, was bei neueren Techniken insbesondere aus dem
DVD-Bereich zumindest derzeit noch nicht uneingeschränkt gesagt
werden kann.
Bevorzugte
Ausführungsbeispiele
der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf
die beiliegenden Figuren detailliert erläutert. Es zeigen:
1 ein
Blockschaltbild der erfindungsgemäßen Vorrichtung zum Schreiben
einer Kompakt-Disk;
2 ein
Blockdiagramm einer erfindungsgemäßen Vorrichtung zum Abspielen
einer Kompakt-Disk;
3 einen
bekannten Joint-Stereo-Codierer zum Erzeugen von Kanaldaten und
parametrischen Multikanal-Informationen;
4 eine
Darstellung eines Schemas zum Bestimmen von ICLD-, ICTD- und ICC-Parametern;
5 eine
Blockdiagrammdarstellung einer BCC-Codierer-/Decodierer-Kette; und
6 ein
Blockdiagramm einer Implementierung des BCC-Synthese-Blocks von 5.
1 zeigt
eine erfindungsgemäße Vorrichtung
zum Beschreiben einer Kompakt-Disk mit Audioinformationen, aus denen
eine Mehrkanalaudiodarstellung rekonstruierbar ist, mit einer Einrichtung
zum Schreiben von parametrischen Mehrkanalinformationen an einer
oder mehreren Stellen der CD, die nicht für zwei Basiskanäle, die
eine Zweikanaldarstellung der Audioinformationen umfassen, vorgesehen
sind.
Insbesondere
sind die parametrischen Mehrkanalinformationen, die nicht durch
die Einrichtung 10 auf die CD geschrieben werden, derart
ausgebildet, daß sie
zusammen mit den zwei Basiskanälen eine
Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen.
Vorzugsweise sind die parametrischen Mehrkanal-Informationen BCC-Parameter
oder Intensity-Stereo-Parameter oder andere parametrische Daten,
die im Gegensatz zu den zwei Stereo-Basiskanälen lediglich eine grobe Darstellung
eines Kanals des ursprünglichen
Multikanal-Audiosignals ist.
Je
nach Ausführungsbeispiel
ist die CD bereits vor dem Beschreiben mit den parametrischen Mehrkanal-Informationen
mit normalen Stereodaten versehen. Dies wäre dann der Fall, wenn nachträglich die
Multikanal-Informationen auf die CD geschrieben werden. Es wird
jedoch bevorzugt, in die erfin dungsgemäße Vorrichtung zum Beschreiben
unbeschriebene Audio-CDs einzubringen, derart, daß die erfindungsgemäße Vorrichtung
auch eine Einrichtung 12 zum Schreiben von Stereodaten
gemäß dem CD-Standard
aufweist. Lediglich aus Darstellungsgründen sind die beiden Einrichtungen
zum Schreiben in 1 als getrennte Einrichtungen
dargestellt. Selbstverständlich
können
sie durch dieselbe physische CD-Beschreibvorrichtung
implementiert sein.
Das
Produkt der erfindungsgemäßen Vorrichtung
ist eine CD 14, die die ganz normalen Stereo-Basiskanäle an für die Stereo-Informationen
vorgesehenen Plätzen
auf der CD umfaßt,
wie es bei 16a dargestellt ist. Im Gegensatz zu einer normalen CD
sind jedoch an Plätzen,
die durch die Stereoinformationen nicht beschrieben sind, also an
einem Platz 16b, Multikanal-Parameterinformationen, wie
beispielsweise 5.1-Parameterinformationen, 7.1-Parameterinformationen
etc. vorhanden. Diese Parameterinformationen sind, wie es bereits
ausgeführt
worden ist, vorzugsweise BCC-Parameterdaten.
Bei
einem bevorzugten Ausführungsbeispiel der
vorliegenden Erfindung werden die Parameterdaten synchron zu den
normalen Stereodaten auf der Audio-CD sektorweise in den dort verfügbaren „Sub-Channels", R, S, T, U, V,
W abgespeichert. Eine Beschreibung der Sub-Channels und des CD-Datenformats
findet sich in dem Lehrbuch „Audio-Handbuch
der Schaltungstechnik",
Paul Skritek, Franzis-Verlag, 1988, Kapitel 17 „Kompakt-Disk-Technik", Seiten 329-338.
Normalerweise
sind diese Sub-Channels dazu vorgesehen, Informationen über die
CD einschließlich
des Inhaltsverzeichnisses und der aktuellen Zeit der Spur für die Angabe
des Wiedergabegeräts
zu speichern. Alternativ können
diese Kanäle auch
verwendet werden, um Graphikdarstellung mit niedriger Auflösung zu
speichern und auf entsprechenden Wiedergabegeräten auszugeben. Diese Sub-Channels
bzw. die auf den Sub-Channels gespeicherten Sub-Codes können auch
dazu verwendet werden, Zusatzinformationen zu speichern, wie sie
beispielsweise für
Karaoke-CDs benötigt
werden.
Erfindungsgemäß werden
diese Sub-Channels nunmehr jedoch dazu verwendet, die Nutzdaten selbst,
also die Stereo-Basisinformationen „aufzuwerten", indem parametrische
Multikanal-Informationen in den Sub-Channels gespeichert werden.
Datenratenmäßig beträgt die Bruttodatenrate,
die zur Verfügung
steht, 7,36 kbps. Da sechs User-Datenkanäle vorhanden sind, stehen insgesamt
also 44,1 kbps an Datenrate zur Verfügung. Dies ist ein Wert, der
sogar größer ist
als die von den BCC-Parametern sogar typischerweise benötigte Datenmenge,
die für 5.1-Mehrkanalinformationen
etwa lediglich gleich der Hälfte
der verfügbaren
Bitrate von 44,1 kbps ist. Für 10.1-Mehrkanalinformationen
würde der
gesamte Platz in den Subchannels benötigt werden.
Bei
einem bevorzugten Ausführungsbeispiel der
vorliegenden Erfindung wird daher eine Fehlerschutzcodierung verwendet,
um die Zusatzdaten, die normalerweise nicht Fehlerschutzcodiert
werden, vor dem Schreiben in die Sub-Channels einer Fehlerschutzcodierung
zu unterziehen, die beim Abspielen wieder rückgängig gemacht wird und insbesondere dazu
dient, Auslesefehler zu korrigieren.
2 zeigt
ein erfindungsgemäßes Widergabegerät, das zunächst, wie
ein normaler CD-Spieler, eine Einrichtung 20 zum Auslesen
der Stereokanäle
umfaßt.
Ferner ist jedoch, zusätzlich
zu einem normalen CD-Player eine Einrichtung 22 zum Auslesen
der Mehrkanal-Parameterinformationen vorgesehen, die jedoch lediglich
eine Zusatzeinrichtung ist, wenn der CD-Player noch nicht zum Auslesen
der Sub-Kanäle
konfiguriert ist, oder wenn die Parameterinformationen an anderen
Stellen der CD gespeichert werden, also nicht an den Sub-Kanälen sondern
an einer oder mehreren getrennten Sessions am Ende der CD oder in
einem Datenbereich einer Hybrid-CD bzw. Hybrid-Partition etc.
Der
Einrichtung 22 nachgeschaltet ist eine Einrichtung 24 zum
Rekonstruieren einer Multikanalausgabe, die an einem Multikanal-Ausgang 26 bereitgestellt
wird. Ferner ist eine CD-Erkennungseinrichtung oder eine externe
manuelle oder von einem anderen Gerät übernommene Steuerung 28 vorgesehen,
um einen Umschalter 30 zu betätigen. Wird erkannt, daß die CD
lediglich Stereo-Informationen umfaßt, so wird der Ausgang der
Einrichtung 20 zum Auslesen der Stereokanäle direkt
zu einem Stereoausgang 32 durch den Schalter 30 durchgeschaltet. Erkennt
die CD-Erkennungseinrichtung 28 jedoch, daß es sich
hier um eine Audio-CD mit Multikanaldaten z. B. in den Sub-Channels
handelt, so wird der Ausgang der Einrichtung 20 zum Auslesen
der Stereokanäle
durch den Schalter 30 umgeschaltet und der Einrichtung 24 zum
Rekonstruieren zugeführt,
derart, daß eine
Multikanalausgabe erzeugt wird, und keine oder lediglich eine zusätzliche
Stereoausgabe am Ausgang 32 geliefert wird.
Es
sei darauf hingewiesen, dass der Schalter 30 in 2 auch
durch eine Verzweigung ersetzt werden kann, so dass parallel sowohl
das normale Stereosignal (z. B. über
einen Analogausgang des Players oder über einen ersten Digitalausgang
des Players) als auch das Stereosignal samt Mehrka nalinformationen über einen
hierfür
vorgesehen bei CD-Playern
normalerweise vorhandenen Digitalausgang ausgegeben werden. An diesem
Digitalausgang wird das die erfindungsgemäße Erweiterungsbox angebracht,
die dann ausgangsseitig den rekonstruierten Mehrkanalton mit mehr
als zwei Kanälen ausgibt.
Ein
solcher Abspieler ist somit in der Lage, entweder stereophon oder
bei Decodierung der parametrischen Multikanaldaten einen Ton mit
mehr als zwei Kanälen,
also beispielsweise einen 5.1-Surround-Ton wiederzugeben.
Abhängig von
den Gegebenheiten kann das erfindungsgemäße Verfahren zum Schreiben
einer Kompakt-Disk oder zum Abspielen einer Kontakt-Disk in Hardware
oder in Software implementiert werden. Die Implementierung kann
auf einem digitalen Speichermedium, insbesondere einer Diskette oder
CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so
mit einem programmierbaren Computersystem zusammenwirken können, daß das Verfahren
ausgeführt
wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit einem
auf einem maschinenlesbaren Träger
gespeicherten Programmcode zur Durchführung eines erfindungsgemäßen Verfahrens, wenn
das Computer-Programm-Produkt auf einem Rechner abläuft. In
anderen Worten ausgedrückt kann
die Erfindung somit als ein Computer-Programm mit einem Programmcode
zur Durchführung des
Verfahrens realisiert werden, wenn das Computer-Programm auf einem
Computer abläuft.