WO2005083702A1

WO2005083702A1 - Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd

Info

Publication number: WO2005083702A1
Application number: PCT/EP2005/001650
Authority: WO
Inventors: Harald Popp; Stefan Geyersberger; Wolfgang Fiesel
Original assignee: Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date: 2004-02-27
Filing date: 2005-02-17
Publication date: 2005-09-09
Also published as: US20070121448A1; KR100813192B1; EP1719128A1; US8989881B2; CN1934640B; KR20060134973A; CN1934640A; DE102004009628A1

Abstract

Eine normale standardgemäße Audio-Kompakt-Disk wird z. B. in den User-Subchannels mit parametrischen Mehrkanal-Informationen (16 b)beschrieben, so daß die CD eine normale Stereo-Wiedergabe mit einem normalen Wiedergabegerät ermöglicht, oder aber eine Multikanalwiedergabe mit einem einfach anschließbaren Zusatzgerät, das sowohl die Stereoinformationen(16 a) als auch die parametrischen Mehrkanal-Informationen (16 b) aus der an sich standardkonformen Audio-CD ausliest und daraus mehr als zwei Audiokanäle rekonstruiert.

Description

Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD

Beschreibung

Die vorliegende Erfindung bezieht sich auf die Stereo- Audio-CD-Technik und insbesondere auf Vorrichtungen und Verfahren zum Beschreiben von Audio-CDs sowie entsprechende Verfahren und Vorrichtungen zum Wiedergewinnen von Daten von CDs.

In letzter Zeit wird die Multikanal-Audio- Reproduktionstechnik immer wichtiger. Dies kann auf die Tatsache zurückzuführen sein, daß Audiokompressions- /Codier-Techniken, wie beispielsweise die bekannte MP3- Technik, es möglich gemacht haben, Audiodaten über das Internet oder andere Übertragungskanäle mit einer begrenzten Bandbreite zu übertragen. Die MP3-Codiertechnik ist auf- grund der Tatsache so berühmt geworden, daß sie die Verteilung aller Aufzeichnungen in einem Stereoformat ermöglicht, d. h. in einer digitalen Darstellung der Audioaufzeichnung, die einen ersten oder linken Stereokanal und einen zweiten oder rechten Stereokanal umfaßt.

Alternative Medien zum Verteilen von Stereo-Daten sind die bekannten Audio-CDs. Die aus der Zusammenarbeit von Philips und Sony entwickelte digitale Kompakt-Disk basiert auf einer berührungslosen optischen Abtastung mittels Laser von einer einseitig bespielten Platte als Informationsträger. Im CD-Spieler wird zum Auslesen der von der Platte reflektierte und in seiner Intensität modulierte Strahl eines Halbleiterlasers von einer Photodiode empfangen. Deren Aus- gangssignal wird in ein serielles Datensignal umgewandelt und das Taktsignal daraus gewonnen. Es folgt die Abtrennung der Synchronisationszeichen und die Rückumwandlung des Kanalcodes in Daten, Prüfzeichen und Steuerungs-/Anzeige- Bits. Der Steuerungs-/Anzeige-Decoder liefert die Signale für Motordrehzahl, Fokussierung und Spurnachführung sowie für das Auffinden bestimmter Musikstellen und deren Anzeige. Im Fehlerschutz-Decodierer erfolgt mit Hilfe der Prüfbits eine allfällige Ergänzung gestörter Signalinformatio- nen. Nach der Trennung des Datenstroms mittels des Multi- plexers erfolgt die Digital-/Analog-Rückwandlung in das a- naloge Audiosignal des linken und rechten Kanals.

Gemäß dem standardisierten CD-Rahmenaufbau, den sämtliche Audio-CDs mit Stereoinformationen haben, und auf den übliche CD-Spieler eingestellt sind, sind je sechs aufeinanderfolgende Abtastwerte des linken und des rechten Kanals in einem Rahmen. Die Übertragung beginnt jeweils mit dem linken Kanal. Jeder 16-Bit-Abtastwert beginnt mit dem MSB und wird in zwei Audiosymbole zu je 8 Bit unterteilt. Die Stereodaten sind einer Fehlerschutzcodierung mit einem zweistufigen sogenannten CIRC-Verfahren unterzogen.

Trotzdem existieren grundsätzliche Nachteile herkömmlicher 2-Kanal-Tonsysteme. Daher wurde die sogenannte Surround- Technik entwickelt. Eine empfohlene Multikanal-Surround- Darstellung umfaßt zusätzlich zu den zwei Stereokanälen L und R einen zusätzlichen Mittenkanal C und zwei Surround- Kanäle Ls, Rs. Dieses Referenztonformat wird auch als 3/2- Stereo bezeichnet, was bedeutet, daß drei vordere Kanäle und zwei Surround-Kanäle existieren. Allgemein werden fünf Übertragungskanäle benötigt. In einer Wiedergabeumgebung werden zumindest fünf Lautsprecher an den jeweiligen fünf unterschiedlichen Plätzen benötigt, um einen optimalen sogenannten „Sweet-Spot" in einem bestimmten Abstand von fünf genau plazierten Lautsprechern zu erhalten.

Im Bereich der CD-Technik haben sich die sogenannte DVDs durchgesetzt. Diese enthalten typischerweise eine komplette vollständige 5.1- oder 7.1-AufZeichnung, also eine komplette Darstellung jedes einzelnen Tonkanals.

Nachteilig an DVDs ist jedoch die Tatsache, daß für sie eigene DVD-Spieler benötigt werden, und daß also herkömmliche Audio-CD-Abspielgeräte nicht dazu verwendet werden können, DVDs abzuspielen. Darüber hinaus existiert ferner keine Möglichkeit, solche normalen Audio-CD-Spieler mit einfachen Maßnahmen „upzugraden", so daß sie in der Lage wären, nicht nur Audio-CDs abzuspielen, sondern auch DVDs.

Dies ist insbesondere bedauerlich, da eine große Anzahl von CD-Spielern im Umlauf ist, mit denen keine Multikanal- Wiedergabe erreichbar ist. Andererseits scheuen jedoch viele Kunden davor zurück, den komplett funktionsfähigen CD- Player, mit dem sie vertraut und rundum zufrieden sind, „auszumustern", um nunmehr nur noch auf DVDs umzusteigen, obgleich die Kunden vielleicht an den auf den DVDs typi- scherweise enthaltenen Videoinformationen überhaupt nicht interessiert sind, sondern nur einfach einen guten 5-Kanal- Sound haben wollen.

Auch über das Internet oder von anderen Quellen enthaltene codierte Multikanaldarstellungen könnten zwar auf CDs gebrannt werden, wenn keine Lizenzrechte im Wege stehen. Doch auch solche gebrannten CDs sind nicht mit normalen CD- Playern kompatibel, da sie codierte Informationen enthal- ten, während die auf den Audio-CDs enthaltenen Stereodaten lediglich un-komprimierte 16-Bit-PCM-Daten sind, die lediglich einer Fehlerschutzcodierung unterzogen sind, die zu einer Erhöhung der Datenrate führt, und keiner Datenkomp- rimierung unterzogen sind, die zu einer Reduktion der Datenrate führen würde.

So existieren in der Technik viele Techniken zum Reduzieren der Datenmenge, die zur Übertragung eines Multikanal- Audiosignals benötigt wird. Solche Techniken werden Joint- Stereo-Techniken genannt. Zu diesem Zweck wird auf Fig. 3 verwiesen, die eine Joint-Stereo-Vorrichtung 60 zeigt. Diese Vorrichtung kann eine Vorrichtung sein, die beispielsweise die Intensity-Stereo- (IS-) Technik oder die Binaural Cue Codiertechnik (BCC) implementiert. Ein solches Gerät empfängt üblicherweise als Eingangssignal zumindest zwei Kanäle CH1, CH2, .... CHn, und gibt einen einzigen Trägerkanal sowie parametrische Multikanalinformationen aus. Die parametrischen Daten sind so definiert, daß in einem Deco- dierer eine Approximation eines ürsprungskanals (CH1, CH2, ..., CHn) berechnet werden kann.

Normalerweise wird der Trägerkanal Subband-Abtastwerte, Spektralkoeffizienten, Zeitbereichsabtastwerte etc. u fas- sen, die eine relativ feine Darstellung des zugrundeliegenden Signals liefern, während die parametrischen Daten keine solchen Abtastwerte oder Spektralkoeffizienten umfassen, sondern Steuerparameter zum Steuern eines bestimmten Rekonstruktionsalgorithmus, wie beispielsweise Gewichten durch Multiplizieren, durch Zeitverschieben, durch Frequenzverschieben, etc. Die parametrischen Multikanalinformationen umfassen daher eine relativ grobe Darstellung des Signals oder des zugeordneten Kanals. In Zahlen ausgedrückt beträgt die Menge an Daten, die von einem Trägerkanal benötigt wird, eine Menge von etwa 60 bis 70 kBit/s, während die Menge an Daten, die durch parametrische Seiteninformationen für einen Kanal benötigt wird, im Bereich von 1,5 bis 2,5 kBit/s ist. Es sei darauf hingewiesen, daß die vorstehenden Zahlen für komprimierte Daten gelten. Selbstverständlich benötigt ein nicht-komprimierter CD-Kanal Datenraten im Bereich von etwa dem Zehnfachen. Ein Beispiel für parametrische Daten sind die bekannten Skalenfaktoren, Intensity- Stereo-Informationen oder BCC-Parameter, wie es nachfolgend dargelegt wird.

Die Technik der Intensity-Stereo-Codierung ist in dem AES- Preprint 3799, „Intensity Stereo Coding", J. Herre, K.H. Brandenburg, D. Lederer, Februar 1994, Amsterdam beschrieben. Allgemein basiert das Konzept von Intensity Stereo auf einer Hauptachsentransformation, die auf Daten beider stereophoner Audiokanäle durchzuführen ist. Wenn die meisten Datenpunkte um die erste Hauptachse herum konzentriert sind, kann ein Codiergewinn erreicht werden, indem beide Signale um einen bestimmten Winkel gedreht werden, bevor die Codierung stattfindet. Dies ist jedoch nicht immer für reale stereophone Reproduktionstechniken gegeben. Daher wird diese Technik dahingehend modifiziert, daß die zweite orthogonale Komponente von der Übertragung in dem Bitstrom ausgeschlossen wird. Somit bestehen die rekonstruierten Signale für den linken und den rechten Kanal aus unterschiedlich gewichteten oder skalierten Versionen desselben übertragenen Signals. Dennoch unterscheiden sich die rekon- struierten Signale in ihrer Amplitude, sie sind jedoch i- dentisch im Hinblick auf ihre Phaseninformationen. Die E- nergie-Zeit-Hüllkurven beider ursprünglicher Audiokanäle werden jedoch durch die selektive Skalierungsoperation bei- behalten, die typischerweise auf frequenzselektive Art und Weise arbeitet. Dies entspricht der menschlichen Wahrnehmung des Schalls bei hohen Frequenzen, wo die dominanten räumlichen Informationen durch die Energiehüllkurven be- stimmt werden.

Zusätzlich wird bei praktischen Implementierungen das übertragene Signal, d. h. der Trägerkanal aus dem Summensignal des linken Kanals und des rechten Kanals anstatt der Rota- tion beider Komponenten erzeugt. Ferner wird diese Verarbeitung, d. h. das Erzeugen von Intensity-Stereo-Parametern zum Durchführen der Skalierungsoperationen frequenzselektiv durchgeführt, d. h. unabhängig für jedes Skalenfaktorband, d. h. für jede Codiererfrequenzpartition. Vorzugsweise wer- den beide Kanäle kombiniert, um einen kombinierten oder „Träger"-Kanal und zusätzlich zu dem kombinierten Kanal die Intensity-Stereo-Informationen zu bilden. Die Intensity- Stereo-Informationen hängen von der Energie des ersten Kanals, der Energie des zweiten Kanals oder der Energie des kombinierten Kanals ab.

Die BCC-Technik ist in dem AES-Convention-Paper 5574 „Bi- naural Cue Coding applied to stereo and multichannel audio compression", T. Faller, F. Baumgarte, Mai 2002, München, beschrieben. Bei der BCC-Codierung wird eine Anzahl von Audioeingangskanälen in eine Spektraldarstellung umgewandelt, und zwar unter Verwendung einer DFT-basierten Transformation mit überlappenden Fenstern. Das resultierende Spektrum wird in nicht-überlappende Abschnitte eingeteilt, von denen jeder einen Index hat. Jede Partition hat eine Bandbreite proportional zu der äquivalenten Rechteckbandbreite (ERB) . Die Inter-Kanal-Pegelunterschiede (ICLD; ICLD = Inter Channel Level Differences) und die Interkanal-Zeitunterschiede (ICTD; ICTD = Inter Channel Time Differences) werden für jede Partition und für jeden Frame k ermittelt. Die ICLD und ICTD werden quantisiert und codiert, um schließlich als Seiteninformationen in einen BCC-Bitstrom zu kommen. Die Interkanal-Pegelunterschiede und die Interkanal- Zeitunterschiede sind für jeden Kanal relativ zu einem Referenzkanal gegeben. Dann werden die Parameter gemäß vorbestimmter Formeln berechnet, die von den bestimmten Partiti- onen des zu verarbeitenden Signals abhängen.

Auf Decodiererseite empfängt der Decodierer typischerweise ein Monosignal und den BCC-Bitstrom. Das Monosignal wird in den Frequenzbereich transformiert und in einen Raumsyntheseblock (Spatial-Syntheseblock) eingegeben, der auch deco- dierte ICLD- und ICTD-Werte empfängt. In dem Spatial- Syntheseblock werden die BCC-Parameter (ICLD und ICTD) verwendet, um eine Gewichtungsoperation des Monosignals durchzuführen, um die Multikanalsignale zu synthetisieren, die, nach einer Frequenz-/Zeit-Ümwandlung eine Rekonstruktion des ursprünglichen Multikanal-Audiosignals darstellen.

Im Fall von BCC ist das Joint-Stereo-Modul 60 wirksam, um die kanalseitigen Informationen so auszugeben, daß die parametrischen Kanaldaten quantisierte und codierte ICLD- o- der ICTD-Parameter sind, wobei einer der ursprünglichen Kanäle als Referenzkanal zum Codieren der Kanalseiteninformationen verwendet wird.

Normalerweise wird der Trägersignal aus der Summe der teil- nehmenden ürsprungskanäle gebildet.

Natürlich liefern die obigen Techniken nur eine Monodar- stellung für einen Decodierer, der nur den Trägerkanal ver- arbeiten kann, der jedoch nicht in der Lage ist, die parametrischen Daten zur Erzeugung von einer oder mehreren Approximationen von mehr als einem Eingangskanal zu verarbeiten.

Die BCC-Technik ist auch in den US-Patentveröffentlichungen US 2003/0219130 AI, US 2003/0026441 AI und US 2003/0035553 AI beschrieben. Zusätzlich wird auf die Fachveröffentlichung „Binaural Cue Coding. Part II: Schemes and Applica- tions", T. Faller und F. Baumgarte, IEEE Trans. On Audio and Speech Proc. Bd. 11, Nr. 6, November 2003 verwiesen.

Nachfolgend wird ein typisches BCC-Schema zur Multikanalau- diocodierung detaillierter dargestellt, und zwar Bezug neh- mend auf die Fig. 4 bis 6.

Fig. 5 zeigt ein solches BCC-Schema zur Codierung/Übertragung von Multikanalaudiosignalen. Das Multika- nalaudioeingangssignal an einem Eingang 110 eines BCC- Codierers 112 wird in einem sogenannten Downmix-Block 114 heruntergemischt. Bei diesem Beispiel ist das ursprüngliche Multikanalsignal an dem Eingang 110 ein 5-Kanal-Surround- Signal mit einem vorderen linken Kanal, einem vorderen rechten Kanal, einem linken Surround-Kanal, einem rechten Surround-Kanal und einem Mittenkanal. Bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung erzeugt der Downmix-Block 114 ein Summensignal durch eine einfache Addition dieser fünf Kanäle in ein Monosignal.

Andere Downmixing-Schemen sind in der Technik bekannt, so daß unter Verwendung eines Multikanal-Eingangssignals ein Downmix-Kanal mit einem einzigen Kanal erhalten wird. Dieser einzige Kanal wird an einer Summensignalleitung 115 ausgegeben. Eine Seiteninformation, die von dem BCC- Analyseblock 116 erhalten wird, wird auf einer Seiteninformationsleitung 117 ausgegeben.

Bei dem BCC-Analyseblock werden Interkanal- Pegelunterschiede (ICLD) und Interkanal-Zeitunterschiede (ICTD) berechnet, wie es vorstehend dargestellt worden ist. Neuerdings ist der BCC-Analyseblock 116 auch in der Lage, Interkanal-Korrelationswerte (ICC-Werte) zu berechnen. Das Summensignal und die Seiteninformationen werden in einem quantisierten und codierten Format zu einem BCC-Decodierer 120 übertragen. Der BCC-Decodierer zerlegt das übertragene Summensignal in eine Anzahl von Subbändern und führt Ska- lierungen, Verzögerungen und andere Verarbeitungsschritte aus, um die Subbänder der auszugebenden Multikanal- Audiokanäle zu liefern. Diese Verarbeitung wird so durchgeführt, daß die ICLD-, ICTD- und ICC-Parameter (Cues) eines rekonstruierten Multikanalsignals am Ausgang 121 mit den entsprechenden Cues für das ursprüngliche Multikanalsignal am Eingang 110 in dem BCC-Codierer 112 übereinstimmen. Zu diesem Zweck umfaßt der BCC-Decodierer 120 einen BCC- Syntheseblock 122 und einen Seiteninformationenüberarbei- tungsblock 123.

Nachfolgend wird der interne Aufbau des BCC-Syntheseblocks 122 Bezug nehmend auf Fig. 6 dargestellt. Das Summensignal auf der Leitung 115 wird in eine Zeit-/Frequenz- Umwandlungseinheit oder Filterbank FB 125 eingespeist. Am Ausgang des Blocks 125 existiert eine Anzahl N von Subband- signalen oder, in einem Extremfall, ein Block von Spektralkoeffizienten, wenn die Audio-Filterbank 125 eine 1:1- Transformation durchführt, d. h. eine Transformation, die N Spektralkoeffizienten aus N Zeitbereichsabtastwerten erzeugt.

Der BCC-Syntheseblock 122 umfaßt ferner eine Verzögerungs- stufe 126, eine Pegelmodifikationsstufe 127, eine Korrelationsverarbeitungsstufe 128 und eine Inversfilterbankstufe IFB 129. Am Ausgang der Stufe 129 kann das rekonstruierte Multikanalaudiosignal mit beispielsweise fünf Kanälen im Falle eines 5-Kanal-Surroundsystems zu einem Satz von Laut- Sprechern 124 ausgegeben werden, wie sie in Fig. 5 oder Fig. 4 dargestellt sind.

Das Eingangssignal sn wird in den Frequenzbereich oder den Filterbankbereich mittels des Elements 125 umgewandelt. Das Signal, das vom Element 125 ausgegeben wird, wird derart kopiert, daß mehrere Versionen desselben Signals erhalten werden, wie es durch den Kopierknoten 130 dargestellt ist. Die Anzahl der Versionen des ursprünglichen Signals ist gleich der Anzahl der Ausgangskanäle in dem Ausgangssignal. Dann wird jede Version des ursprünglichen Signals am Knoten 130 einer bestimmten Verzögerung di, d₂, ..., di, ... d_N unterzogen. Die Verzögerungsparameter werden durch den Seiteninformationsverarbeitungsblock 123 in Fig. 5 berechnet und von den Interkanal-Zeitunterschieden, wie sie durch den BCC-Analyseblock 116 von Fig. 5 berechnet worden sind, abgeleitet.

Dasselbe gilt für die Multiplikationsparameter ai, a₂, ..., ai, ..., a_N, die ebenfalls durch den Seiteninformationsver- arbeitungsblock 123 basierend auf den Interkanal- Pegelunterschieden, wie sie durch den BCC-Analyseblock 116 berechnet worden sind, berechnet werden. Die durch den BCC-Analyseblock 116 berechneten ICC- Parameter werden zum Steuern der Funktionalität des Blocks 128 verwendet, so daß bestimmte Korrelationen zwischen den verzögerten und in ihren Pegeln manipulierten Signalen an den Ausgängen des Blocks 128 erhalten werden. Es sei hier darauf hingewiesen, daß die Reihenfolge der Stufen 126, 127, 128 von der in Fig. 6 gezeigten Reihenfolge abweichen kann.

Es sei darauf hingewiesen, daß bei einer rahmenweisen Verarbeitung des Audiosignals auch die BCC-Analyse rahmenweise durchgeführt wird, also zeitlich variabel, und daß ferner eine frequenzweise BCC-Analyse erhalten wird, wie es durch die Filterbank-Aufteilung aus Fig. 6 ersichtlich ist. Dies bedeutet, daß die BCC-Parameter für jedes Spektralband erhalten werden. Dies bedeutet ferner, daß in dem Fall, in dem die Audiofilterbank 125 das Eingangssignal in beispielsweise 32 Bandpaßsignale zerlegt, der BCC-Analyseblock einen Satz von BCC-Parametern für jedes der 32 Bänder er- hält. Natürlich führt der BCC-Syntheseblock 122 von Fig. 5, der detailliert in Fig. 6 dargestellt ist, eine Rekonstruktion durch, die auch auf den beispielhaft genannten 32 Bändern basiert.

Nachfolgend wird Bezug nehmend auf Fig. 4 ein Szenario dargestellt, das dazu verwendet wird, um einzelne BCC- Parameter zu bestimmen. Normalerweise können die ICLD-, ICTD- und ICC-Parameter zwischen Kanalpaaren definiert werden. Es wird jedoch bevorzugt, die ICLD- und ICTD-Parameter zwischen einem Referenzkanal und jedem anderen Kanal zu bestimmen. Dies ist in Fig. 4A dargestellt. ICC-Parameter können auf verschiedene Arten und Weisen definiert werden. Allgemein gesagt kann man ICC-Parameter in dem Codierer zwischen allen möglichen Kanalpaaren bestimmen, wie es in Fig. 4B dargestellt ist. Es wurde jedoch vorgeschlagen, nur ICC-Parameter zwischen den stärksten zwei Kanälen zu einem Zeitpunkt zu berechnen, wie es in Fig. 4C dargestellt ist, wo ein Beispiel gezeigt ist, bei dem zu einem Zeitpunkt ein ICC-Parameter zwischen den Kanälen 1 und 2 berechnet wird, und zu einem anderen Zeitpunkt ein ICC-Parameter zwischen den Kanälen 1 und 5 berechnet wird. Der Decodierer synthetisiert dann die Interkanalkor- relation zwischen den stärksten Kanälen in dem Decoder und verwendet bestimmte heuristische Regeln zum Berechnen und Synthetisieren der Interkanalkohärenz für die restlichen Kanalpaare.

Bezüglich der Berechnung beispielsweise der Multiplikationsparameter ai, a_N basierend auf den übertragenen ICLD- Parametern wird auf das AES-Convention-Paper Nr. 5574 Bezug genommen. Die ICLD-Parameter stellen eine Energieverteilung eines ursprünglichen Mehrkanalsignals dar. Ohne Verlust der Allgemeinheit wird es bevorzugt, wie es in Fig. 4A gezeigt, vier ICLD-Parameter zu nehmen, die die Energiedifferenz zwischen den jeweiligen Kanälen und dem vorderen linken Ka- nal darstellen. In dem Seiteninformationsverarbeitungsblock 122 werden die Multiplikationsparameter ai, ... , a_N von den ICLD-Parametern so abgeleitet, daß die gesamte Energie aller rekonstruierter Ausgangskanäle dieselbe ist (oder proportional zu der Energie des übertragenen Summensignals ist) .

Um Multikanalinformationen auf CDs zu bringen, kann außer den vorgesehenen DVDs auch auf spezielle Audio-CDs zurück- gegriffen werden, die mit Hilfe von Audiocodierverfahren, wie beispielsweise DTS, die Tonkanäle in datenreduzierter Form speichern. Diese speziellen Audio-CDs lassen sich auf normalen Audio-CD-Spielern nicht wiedergeben, sondern er- fordern einen meistens extern an den digitalen Ausgang des normalen Audio-CD-Spieler anzuschließenden eigenen Decodierer.

Ferner existieren Hybrid-SACDs, die mit Hilfe von zwei Schichten auf der CD sowohl den herkömmlichen Stereoton zur Wiedergabe auf Audio-CD-Spielern (in der einen Schicht) als auch den Mehrkanalton im DSC-Format (in der anderen Schicht) zur Wiedergabe auf SACD-Spielern bieten.

Die Aufgabe der vorliegenden Erfindung besteht darin, ein flexibles und eine potentiell hohe Marktakzeptanz erreichendes Konzept zum Verbreiten und Erzeugen von Multikanal- Audiodaten zu schaffen.

Diese Aufgabe wird durch eine Vorrichtung zum Beschreiben einer Kompakt-Disk gemäß Patentanspruch 1, eine Kompakt- Disk gemäß Patentanspruch 9, eine Vorrichtung zum Abspielen einer Kompakt-Disk nach Patentanspruch 10, ein Verfahren zum Beschreiben einer Kompakt-Disk nach Patentanspruch 12, ein Verfahren zum Abspielen einer Kompakt-Disk nach Patentanspruch 13 oder ein Computer-Programm nach Patentanspruch 14 gelöst.

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß auf einer üblichen Audio-CD gemäß dem normalen CD- Format Subchannels vorgesehen sind, die gemäß dem CD- Standard definiert sind, um Metainformationen, wie Daten und Text bzw. ein Videobild zu übertragen. Erfindungsgemäß werden diese Subchannels dazu genutzt, um Parameterinformationen mit auf die normale Stereo-Audio-CD zu schreiben, so daß eine normale Stereo-Audio-CD genug Informationen für eine Multikanal-Wiedergabe umfaßt.

Ein Vorteil dieses Konzepts besteht darin, daß es mit üblichen CD-Playern kompatibel ist. Übliche CD-Player liefern dann nach wie vor eine Stereo-Klangdarstellung der normalen Audio-CD-Stereodaten, die durch das erfindungsgemäße Kon- zept nicht beeinflußt werden. Ist ein CD-Player jedoch erfindungsgemäß ausgestattet, also durch ein kleines Zusatzmodul, das an dem CD-Player ausgangsseitig die Stereodaten neben den Sub-Channel-Daten, also den Multikanal- Parameterdaten empfängt und unter Verwendung des zugrunde- liegenden Rekonstruktionsalgorithmus die Parameterdaten und die Stereodaten miteinander verrechnet, so wird eine Multi- kanaldarstellung des ursprünglichen Multikanalsignals geliefert.

Damit wird erreicht, daß ein Benutzer seinen normalen CD-

Player, an den er sich gewöhnt hat, und mit dem er zufrieden ist, behalten kann und zum Lesen der Multikanal-Audio- CDs lediglich noch das Zusatzmodul benötigt, das jedoch ohne weiteres an den CD-Player anschließbar ist, da jeder CD- Player einen Stereo-Ausgang hat. Damit muß das Zusatzmodul nicht in den CD-Player eingreifen, sondern kann einfach an dem ohnehin von dem CD-Player vorgesehenen Anschluß angesteckt werden. Vorzugsweise ist dieser Anschluß bzw. Ausgang des CD-Players ein digitaler Ausgang. Hat ein CD- Player jedoch lediglich einen analogen Ausgang, was bei ganz alten Modellen der Fall sein kann, so würde zusätzlich noch ein Analog-/Digital-Wandler in dem Zusatz-Mehrkanal- Modul benötigt werden. Die vorliegende Erfindung ist ferner dahingehend vorteilhaft, dass bei einer rückwärtskompatiblen Aufzeichnung der Mehrkanalinformationen die CD rückwärtskompatibel ist, also genauso auch auf einem Stereo-CD-Player herkömmlicher Natur abgespielt werden kann. Die erfindungsgemäße CD kann also sowohl auf einem normalen CD-Player als auch auf ein Multi- kanal-erweiterten CD-Player abgespielt werden.

Alternativ können die Mehrkanal-Parameterinformationen auch an anderen Stellen der Audio-CD untergebracht werden, die nicht von der Zweikanaldarstellung belegt sind, beispielsweise an einer noch freien Stelle der CD, auf einer Daten- Partition einer Hybrid-CD, an einer getrennten Session am Ende der CD etc.

Bevorzugt wird jedoch, die Parameterdaten bereits auf die Subchannels, die ohnehin bereits vom normalen Audio-CD- Standard vorgesehen sind, zu „verstecken", da dann keiner- lei Eingriffe in CDs vorgesehen sind, und da die CDs trotz der Tatsache, daß sie nun Multikanal-Toninformationen haben, dennoch komplett standardgemäß sind und somit auch keine Probleme in Abspielgeräten verursachen.

Das erfindungsgemäße Konzept ist fern dahingehend vorteilhaft, daß durch Darstellung der Multikanalinformation durch parametrische Multikanal-Daten die Datenmenge ausreichend komprimiert wird, so daß die Kanalkapazität der Subchannels auf der CD ausreichend groß ist. Selbstverständlich wäre es nicht möglich, auf diesen Subchannels Nicht-Parameter- Informationen, wie sie auf der DVD zu finden sind, zu speichern. Ein weiterer Vorteil der vorliegenden Erfindung besteht darin, daß bestehende CD-Beschreibgeräte verwendet werden können, da diese ohnehin schon dafür ausgelegt waren, Daten in die User-Subchannels zu schreiben.

Ferner können bereits bestehende CD-Abspielgeräte verwendet werden, die für das Lesen von Subchannels ausgelegt sind.

Damit kann mit minimalem Aufwand auf Seiten des CD- Herstellers, im Hinblick auf die CD selbst sowie auf Seiten des Benutzers aus einer Stereo-CD eine Multikanal-CD mit zumindest 3 und vorzugsweise 5, 7 oder noch mehr Kanälen gemacht werden. Dies alles wird mit der bewährten Audio-CD- Technik erreicht, die seit Jahren ausgereift, bewährt und akzeptiert ist, was bei neueren Techniken insbesondere aus dem DVD-Bereich zumindest derzeit noch nicht uneingeschränkt gesagt werden kann.

Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Figuren detailliert erläutert. Es zeigen:

Fig. 1 ein Blockschaltbild der erfindungsgemäßen Vorrichtung zum Schreiben einer Kompakt-Disk;

Fig. 2 ein Blockdiagramm einer erfindungsgemäßen Vorrichtung zum Abspielen einer Kompakt-Disk;

Fig. 3 einen bekannten Joint-Stereo-Codierer zum Erzeu- gen von Kanaldaten und parametrischen Multikanalinformationen; Fig. 4 eine Darstellung eines Schemas zum Bestimmen von ICLD-, ICTD- und ICC-Parametern;

Fig. 5 eine Blockdiagrammdarstellung einer BCC-Codierer- /Decodierer-Kette; und

Fig. 6 ein Blockdiagramm einer Implementierung des BCC- Synthese-Blocks von Fig. 5.

Fig. 1 zeigt eine erfindungsgemäße Vorrichtung zum Beschreiben einer Kompakt-Disk mit Audioinformationen, aus denen eine Mehrkanalaudiodarstellung rekonstruierbar ist, mit einer Einrichtung zum Schreiben von parametrischen Mehrkanalinformationen an einer oder mehreren Stellen der CD, die nicht für zwei Basiskanäle, die eine Zweikanaldarstellung der Audioinformationen umfassen, vorgesehen sind.

Insbesondere sind die parametrischen Mehrkanalinformationen, die nicht durch die Einrichtung 10 auf die CD ge- schrieben werden, derart ausgebildet, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen. Vorzugsweise sind die parametrischen Mehrkanal-Informationen BCC-Parameter oder Intensity-Stereo-Parameter oder andere parametrische Daten, die im Gegensatz zu den zwei Stereo-Basiskanälen lediglich eine grobe Darstellung eines Kanals des ursprünglichen Multikanal-Audiosignals ist.

Je nach Ausführungsbeispiel ist die CD bereits vor dem Be- schreiben mit den parametrischen Mehrkanal-Informationen mit normalen Stereodaten versehen. Dies wäre dann der Fall, wenn nachträglich die Multikanal-Informationen auf die CD geschrieben werden. Es wird jedoch bevorzugt, in die erfin- dungsgemäße Vorrichtung zum Beschreiben unbeschriebene Audio-CDs einzubringen, derart, daß die erfindungsgemäße Vorrichtung auch eine Einrichtung 12 zum Schreiben von Stereodaten gemäß dem CD-Standard aufweist. Lediglich aus Dar- Stellungsgründen sind die beiden Einrichtungen zum Schreiben in Fig. 1 als getrennte Einrichtungen dargestellt. Selbstverständlich können sie durch dieselbe physische CD- Beschreibvorrichtung implementiert sein.

Das Produkt der erfindungsgemäßen Vorrichtung ist eine CD 14, die die ganz normalen Stereo-Basiskanäle an für die Stereo-Informationen vorgesehenen. Plätzen auf der CD umfaßt, wie es bei 16a dargestellt ist. Im Gegensatz zu einer normalen CD sind jedoch an Plätzen, die durch die Stereoin- formationen nicht beschrieben sind, also an einem Platz 16b, Multikanal-Parameterinformationen, wie beispielsweise 5.1-Parameterinformationen, 7.1-Parameterinformationen etc. vorhanden. Diese Parameterinformationen sind, wie es bereits ausgeführt worden ist, vorzugsweise BCC- Parameterdaten.

Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung werden die Parameterdaten synchron zu den normalen Stereodaten auf der Audio-CD sektorweise in den dort verfügbaren „Sub-Channels", R, S, T, U, V, W abgespeichert. Eine Beschreibung der Sub-Channels und des CD-Datenformats findet sich in dem Lehrbuch „Audio-Handbuch der Schaltungstechnik", Paul Skritek, Franzis-Verlag, 1988, Kapitel 17 „Kompakt-Disk-Technik", Seiten 329-338.

Normalerweise sind diese Sub-Channels dazu vorgesehen, Informationen über die CD einschließlich des Inhaltsverzeichnisses und der aktuellen Zeit der Spur für die Angabe des Wiedergabegeräts zu speichern. Alternativ können diese Kanäle auch verwendet werden, um Graphikdarstellung mit niedriger Auflösung zu speichern und auf entsprechenden Wiedergabegeräten auszugeben. Diese Sub-Channels bzw. die auf den Sub-Channels gespeicherten Sub-Codes können auch dazu verwendet werden, Zusatzinformationen zu speichern, wie sie beispielsweise für Karaoke-CDs benötigt werden.

Erfindungsgemäß werden diese Sub-Channels nunmehr jedoch dazu verwendet, die Nutzdaten selbst, also die Stereo- Basisinformationen „aufzuwerten", indem parametrische Mul- tikanal-Informationen in den Sub-Channels gespeichert werden. Datenratenmäßig beträgt die Bruttodatenrate, die zur Verfügung steht, 7,36 kbps. Da sechs User-Datenkanäle vor- handen sind, stehen insgesamt also 44,1 kbps an Datenrate zur Verfügung. Dies ist ein Wert, der sogar größer ist als die von den BCC-Parametern sogar typischerweise benötigte Datenmenge, die für 5.1-Mehrkanalinformationen etwa lediglich gleich der Hälfte der verfügbaren Bitrate von 44,1 kbps ist. Für 10.1-Mehrkanalinformationen würde der gesamte Platz in den Subchannels benötigt werden.

Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird daher eine Fehlerschutzcodierung verwendet, um die Zusatzdaten, die normalerweise nicht Fehlerschutz- codiert werden, vor dem Schreiben in die Sub-Channels einer Fehlerschutzcodierung zu unterziehen, die beim Abspielen wieder rückgängig gemacht wird und insbesondere dazu dient, Auslesefehler zu korrigieren.

Fig. 2 zeigt ein erfindungsgemäßes Widergabegerät, das zunächst, wie ein normaler CD-Spieler, eine Einrichtung 20 zum Auslesen der Stereokanäle umfaßt. Ferner ist jedoch, zusätzlich zu einem normalen CD-Player eine Einrichtung 22 zum Auslesen der Mehrkanal-Parameterinformationen vorgesehen, die jedoch lediglich eine Zusatzeinrichtung ist, wenn der CD-Player noch nicht zum Auslesen der Sub-Kanäle konfi- guriert ist, oder wenn die Parameterinformationen an anderen Stellen der CD gespeichert werden, also nicht an den Sub-Kanälen sondern an einer oder mehreren getrennten Ses- sions am Ende der CD oder in einem Datenbereich einer Hyb- rid-CD bzw. Hybrid-Partition etc.

Der Einrichtung 22 nachgeschaltet ist eine Einrichtung 24 zum Rekonstruieren einer Multikanalausgabe, die an einem Multikanal-Ausgang 26 bereitgestellt wird. Ferner ist eine CD-Erkennungseinrichtung oder eine externe manuelle oder von einem anderen Gerät übernommene Steuerung 28 vorgesehen, um einen Umschalter 30 zu betätigen. Wird erkannt, daß die CD lediglich Stereo-Informationen umfaßt, so wird der Ausgang der Einrichtung 20 zum Auslesen der Stereokanäle direkt zu einem Stereoausgang 32 durch den Schalter 30 durchgeschaltet. Erkennt die CD-Erkennungseinrichtung 28 jedoch, daß es sich hier um eine Audio-CD mit Multikanalda- ten z. B. in den Sub-Channels handelt, so wird der Ausgang der Einrichtung 20 zum Auslesen der Stereokanäle durch den Schalter 30 umgeschaltet und der Einrichtung 24 zum Rekon- struieren zugeführt, derart, daß eine Multikanalausgabe erzeugt wird, und keine oder lediglich eine zusätzliche Stereoausgabe am Ausgang 32 geliefert wird.

Es sei darauf hingewiesen, dass der Schalter 30 in Fig. 2 auch durch eine Verzweigung ersetzt werden kann, so dass parallel sowohl das normale Stereosignal (z. B. über einen Analogausgang des Players oder über einen ersten Digitalausgang des Players) als auch das Stereosignal samt Mehrka- nalinformationen über einen hierfür vorgesehen bei CD- Playern normalerweise vorhandenen Digitalausgang ausgegeben werden. An diesem Digitalausgang wird das die erfindungsgemäße Erweiterungsbox angebracht, die dann ausgangsseitig den rekonstruierten Mehrkanalton mit mehr als zwei Kanälen ausgibt.

Ein solcher Abspieler ist somit in der Lage, entweder stereophon oder bei Decodierung der parametrischen Multikanal- daten einen Ton mit mehr als zwei Kanälen, also beispielsweise einen 5. I-Surround-Ton wiederzugeben.

Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Schreiben einer Kompakt-Disk oder zum Abspie- len einer Kontakt-Disk in Hardware oder in Software implementiert werden. Die Implementierung kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, daß das Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm- Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung eines erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.

Claims

Patentansprüche

1. Vorrichtung zum Beschreiben einer Kompakt-Disk mit Audioinformationen, aus denen eine Mehrkanalaudiodarstellung rekonstruierbar ist, mit folgenden Merkmalen: einer Einrichtung (10) zum Schreiben von parametri- sehen Mehrkanal-Informationen an einer oder mehreren Stellen (lβb) der CD, die nicht für zwei Basiskanäle, die eine Zweikanaldarstellung der Audioinformationen umfassen, verwendet werden, wobei die parametrischen Mehrkanal-Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen.

2. Vorrichtung nach Anspruch 1, bei der die CD bereits die Basiskanäle aufweist, bevor die parametrischen Mehrkanalinformationen durch die Einrichtung (10) zum Schreiben geschrieben werden.

3. Vorrichtung nach Anspruch 1, bei der die Einrichtung (10) zum Schreiben ferner ausgebildet ist, um ausgehend von einer CD ohne Audioinformationen sowohl die zwei Basiskanäle als auch die parametrischen Mehrkanal-Informationen zu schreiben.

4. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Basiskanäle Stereokanäle sind und gemäß dem CD-Standard auf der CD geschrieben sind, so daß eine Wiedergabe der zwei Basiskanäle in Stereo mit ei- nem CD-Wiedergabegerät möglich ist, das gemäß dem CD- Standard ausgebildet ist.

5. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung zum Schreiben (10) einen Codierer zur Fehlerschutzcodierung der parametrischen Mehrkanal-Informationen umfaßt, so daß die Einrichtung zum Schreiben ausgebildet ist, um fehlerschutzcodierte parametrische Mehrkanal-Informationen auf die Kompakt- Disk zu schreiben.

6. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (10) zum Schreiben ausgebildet ist, um die parametrischen Mehrkanal-Informationen in einen R-, S-, T-, U-, V- oder W-Subchannel gemäß dem CD-Standard zu schreiben.

7. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (10) zum Schreiben ausgebildet ist, um die parametrischen Mehrkanal-Informationen an einen freien Bereich nach einem Ende oder vor einem Anfang einer Datenaufzeichnung, die durch die zwei Basiskanäle eingenommen wird, zu schreiben.

8. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die CD eine Hybrid-CD mit einem Datenbereich ist, und bei der die Einrichtung (10) zum Schreiben ausgebildet ist, um die parametrischen Mehrkanal- Informationen in den Datenbereich der CD zu schreiben, während die Basiskanäle in einem Audio-CD-Bereich geschrieben sind.

9. Kompakt-Disk mit Audioinformationen, wobei die Audioinformationen zwei Basiskanäle und parametrische Mehrkanal-Informationen umfassen, wobei die Mehrkanal- Informationen an Stellen (16b) auf der Kompakt-Disk geschrieben sind, die nicht durch die zwei Basiskanäle eingenommen sind, wobei die parametrischen Mehrkanal- Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen.

10. Vorrichtung zum Abspielen einer Kompakt-Disk mit Audioinformationen, wobei die Audioinformationen zwei Basiskanäle und parametrische Mehrkanal-Informationen umfassen, wobei die Mehrkanal-Informationen an Stellen (16b) auf der Kompakt-Disk geschrieben sind, die nicht durch die zwei Basiskanäle eingenommen sind, wobei die parametrischen Mehrkanal-Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen, mit folgenden Merkmalen: einer Einrichtung (20, 22) zum Auslesen der zwei Basiskanäle und zum Auslesen der parametrischen Mehrkanal-Informationen; und einer Einrichtung (24) zum Rekonstruieren einer Mehrkanaldarstellung aufgrund der zwei Basiskanäle und der parametrischen Mehrkanal-Informationen.

11. Verfahren zum Beschreiben einer Kompakt-Disk mit Audioinformationen, aus denen eine Mehrkanalaudiodarstellung rekonstruierbar ist, mit folgendem Schritt: Schreiben (10) von parametrischen Mehrkanal- Informationen an einer oder mehreren Stellen (16b) der CD, die nicht für zwei Basiskanäle, die eine Zweikanaldarstellung der Audioinformationen umfassen, vorge- sehen sind, wobei die parametrischen Mehrkanal- Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen.

12. Verfahren zum Abspielen einer Kompakt-Disk mit Audioinformationen, wobei die Audioinformationen zwei Basiskanäle und parametrische Mehrkanal-Informationen umfassen, wobei die Mehrkanal-Informationen an Stellen (16b) auf der Kompakt-Disk geschrieben sind, die nicht durch die zwei Basiskanäle eingenommen sind, wobei die parametrischen Mehrkanal-Informationen derart ausgebildet sind, daß sie zusammen mit den zwei Basiskanälen eine Mehrkanalaudiodarstellung mit mehr als zwei Audiokanälen ermöglichen, mit folgenden Schritten:

Auslesen (20, 22) der zwei Basiskanäle und Auslesen der parametrischen Mehrkanal-Informationen; und

Rekonstruieren (24) einer Mehrkanaldarstellung auf- grund der zwei Basiskanäle und der parametrischen Mehrkanal-Informationen.

13. Computer-Programm mit einem Programmcode zum Durchführen des Verfahrens zum Beschreiben einer Kompakt-Disk gemäß Patentanspruch 11 oder zum Durchführen des Verfahrens zum Abspielen einer Kompakt-Disk gemäß Patentanspruch 12, wenn das Programm auf einem Computer abläuft.