-
HINTERGRUND DER ERFINDUNG
-
Die
Erfindung betrifft ein Verfahren, wie im Oberbegriff von Anspruch
1 angegeben. Die digitale Speicherung von Audiodaten auf einheitlichen
Medien wie etwa Platten oder Bändern
hat weite Verbreitung gefunden. Falls die Audiodaten in mehrere
Untereinheiten unterteilt sind, ermöglicht ein Inhaltsverzeichnis
(Table-of-Contents, TOC), auf eine relativ schnelle Weise auf die
Informationen zuzugreifen. Im Allgemeinen gibt ein Inhaltsverzeichnis
mindestens an, was gespeichert worden ist und wo es gespeichert
worden ist, um in einem Gerät
vom Typ eines Heimplayers den Zugriff zu erleichtern. Solche Audiosignale
können
in einer Umgebung von Personalcomputern und Ähnlichem verwendet werden,
wo verschiedene erweiterte Merkmale angewendet werden. Ein Audioanbieter
wünscht
möglicherweise,
die Informationen auf Plattformen unterschiedlicher Komplexitätsniveaus
jederzeit zugreifbar zu haben.
-
Die
europäische
Patentanmeldung
EP 676 761
A1 offenbart ein Verfahren zur Verwaltung von aufgezeichneten
Informationen auf einem Aufzeichnungsmedium. Die Verwaltung eines
ersten Bereiches (Extent Area, Datenspeicherbereich) wird in ersten
Zuordnungseinheiten (Allocation Blocks, Zuordnungsblöcke) durch
Verwendung erster Verwaltungsinformationen (Volume Space Bitmap)
durchgeführt,
und die Verwaltung eines zweiten Bereiches (Volume Management Area,
Datenträger-Verwaltungsbereich)
wird in zweiten Zuordnungseinheiten (Management Blocks, Verwaltungsblöcke) durch
Verwendung zweiter Verwaltungsinformationen (Management Table, Verwaltungstabelle)
durchgeführt. Es
wird bewirkt, dass die Zuordnungseinheiten sowohl des ersten als
auch des zweiten Bereiches einer unabhängigen Verwaltung unterliegen.
Es ist jedoch nur ein Typ von Verwaltungsinformationen für ein und denselben
Bereich verfügbar.
-
KURZDARSTELLUNG DER ERFINDUNG
-
Demzufolge
ist es unter anderem Aufgabe der vorliegenden Erfindung, verschiedene
Typen einer effizienten Audioverwaltung zu ermöglichen, welche eine kompatible
Zugriffsmöglichkeit
für Player ebenso
wie für
PCs gewährleistet.
Daher ist die Erfindung gemäß einem
ihrer Aspekte gemäß dem kennzeichnenden
Teil von Anspruch 1 gekennzeichnet. Durch die Dateistruktur des
Letzteren sind die Pausen zwischen Audiotracks ebenfalls einbezogen.
Ein Computer, der auf einzelne Tracks zugreift, kann dies nun nicht
nur tun, indem er die eigentlichen Audiodaten über die Trackdateien ansteuert,
sondern stattdessen auch über
die umfassende Datei. Die Erfindung betrifft außerdem ein plattenförmiges Speichermedium
vom optisch lesbaren Typ und eine Einrichtung zum Lesen eines solchen
Mediums. Weitere vorteilhafte Aspekte der Erfindung sind in den
abhängigen
Ansprüchen
angegeben.
-
KURZBESCHREIBUNG DER ZEICHNUNG
-
Diese
und weitere Aspekte und Vorteile der Erfindung werden im Folgenden
unter Bezugnahme auf die Offenbarung bevorzugter Ausführungsformen und
insbesondere unter Bezugnahme auf die beigefügten Figuren ausführlicher
erläutert.
Es zeigen:
-
1a, 1b einen
Aufzeichnungsträger;
-
2 eine
Abspieleinrichtung;
-
3 eine
Aufzeichnungseinrichtung;
-
4 ein
Dateisystem zur Verwendung bei der Erfindung;
-
5 eine
Speicheranordnung für
die Erfindung;
-
6 eine
detaillierte Track-Organisation.
-
AUSFÜHRLICHE BESCHREIBUNG BEVORZUGTER
AUSFÜHRUNGSFORMEN
-
1a zeigt
einen plattenförmigen
Aufzeichnungsträger 11 mit
einer zentralen Bohrung 10 und einer physikalischen Spur
(Track) 19, die in einem spiralförmigen Muster von Windungen
angeordnet ist, so dass im Wesentlichen parallele Strukturen auf einer
Informationsschicht gebildet werden. Der Träger kann eine optische Platte
mit einer beschreibbaren oder einer vorbeschriebenen Informationsschicht sein.
CD-R, CD-RW und
DVD-RAM sind beschreibbar; eine Audio-CD ist vorbeschrieben. Vorbeschriebene
Platten können
hergestellt werden, indem zuerst eine Masterplatte beschrieben wird
und später Kopien
gepresst werden. Die physikalische Spur 19 ist durch eine
vorgeprägte
physikalische Struktur bezeichnet. Die physikalische Spur kann eine Pregroove
(Vorspur) 14 aufweisen, um einem Lese-Schreibkopf zu ermöglichen,
ihr während
des Abtastens zu folgen. Die Informationen sind auf der Informationsschicht
mittels optisch erkennbarer Markierungen entlang der physikalischen
Spur aufgezeichnet, z.B. Pits (Täler)
und Lands (Erhebungen).
-
1b ist
ein Querschnitt entlang der Linie b-b eines beschreibbaren Trägers 11,
wobei ein durchsichtiges Substrat 15 eine Aufzeichnungsschicht 16 und
eine Schutzschicht 17 trägt. Die Pregroove 14 kann
als Vertiefung, eine Erhebung oder als eine Materialeigenschaft,
die von ihrer Umgebung abweicht, realisiert sein.
-
Im
Interesse der Benutzerfreundlichkeit wurden die Audioinformationen
auf dem Träger
in Stücke unterteilt,
welche oft eine Dauer von einigen Minuten haben, z.B. Songs eines
Albums oder Sätze
einer Sinfonie; im Folgenden werden diese als (logische) Tracks
(Spuren) bezeichnet, im Unterschied zu der physikalischen Spur von 1. Der Träger enthält oft Zugriffsinformationen
zum Identifizieren der Stücke, wie
etwa ein Inhaltsverzeichnis (Table Of Contents, TOC), das in einem
Dateisystem enthalten ist, wie ISO 9660 für CD-ROM. Die Zugriffsinformationen können für jedes
Stück Wiedergabezeit,
Startadresse und Songtitel beinhalten.
-
Die
Audioinformationen werden in einer digitalen Darstellung nach einer
Analog-Digital-Wandlung aufgezeichnet. Beispiele einer A/D-Wandlung sind
PCM (Pulscodemodulation) mit 16 Bit pro Sample bei 44,1 kHz, bekannt
von Audio-CDs, und 1 Bit Sigma-Delta-Modulation bei einer hohen
Oversampling-Rate, z.B. 64 × Fs,
Bitstrom (Bitstream) genannt. Das letztgenannte, eine hohe Qualität aufweisende Verfahren
gestattet es, zwischen einer Decodierung hoher Qualität und einer
Decodierung niedriger Qualität
zu wählen.
Diesbezüglich
wird auf die Veröffentlichungen "A digital decimating
filter for analog-to-digital conversion of hi-fi audio signals" von J. J. van der
Kam, Dokument D5 weiter unten, und "A higher order topology for interpolative
modulators for oversampling A/D converters" von Kirk C. H. Chao et al., Dokument
D6, verwiesen. Nach der A/D-Wandlung
können
die digitalen Audiodaten für
die Aufzeichnung zu Audiodaten mit variabler Bitrate komprimiert
werden. Die komprimierten Audiodaten werden dann mit einer solchen
Geschwindigkeit von dem Träger
gelesen, dass nach der Dekomprimierung im Wesentlichen der ursprüngliche
Zeitmaßstab
wiederhergestellt wird, wenn die Audioinformationen kontinuierlich
wiedergegeben werden. Deshalb müssen die
komprimierten Daten von dem Träger
mit einer Geschwindigkeit ausgelesen werden, die von der variierenden
Bitrate abhängig
ist. Die Daten werden von dem Aufzeichnungsträger mit einer so genannten Transfergeschwindigkeit
ausgelesen, d.h. der Geschwindigkeit des Transfers der Datenbytes
von dem Träger
zu einem Dekompressor. Der Aufzeichnungsträger kann eine konstante räumliche
Datendichte aufweisen, so dass die höchste Datenspeicherdichte erreicht
wird. In einem solchen System ist die Transfergeschwindigkeit proportional
zu der relativen linearen Geschwindigkeit zwischen dem Medium und dem
Lese-Schreibkopf.
-
2 zeigt
eine Abspieleinrichtung zum Lesen eines Trägers 11 von dem in 1 dargestellten Typ. Die Einrichtung weist
Antriebsmittel 21 auf, um den Träger 11 in Rotation
zu versetzen, und einen Lesekopf 22 zum Abtasten der physikalischen
Spur. Positionierungsmittel 25 bewirken eine grobe radiale Positionierung
des Lesekopfes 22. Der Lesekopf umfasst ein bekanntes optisches
System mit einer Strahlungsquelle zum Erzeugen eines Strahls 24, welcher
durch optische Elemente hindurch geführt und auf einen Punkt 23 auf
einer Informationsschicht fokussiert wird. Der Lesekopf umfasst
ferner einen Fokussierungs-Aktor (Focusing Actuator) zum Bewegen
des Fokus der Strahlung 24 entlang der optischen Achse
des Strahls und einen Tracking-Aktor (Tracking Actuator) zur Feinpositionierung
des Punktes 23 in einer radialen Richtung auf der Mitte
der physikalischen Spur. Dieser Aktor kann Spulen umfassen, um ein
optisches Element zu bewegen, oder kann dazu vorgesehen sein, den
Winkel eines reflektierenden Elements zu verändern. Die von der Informationsschicht
reflektierte Strahlung wird von einem bekannten Detektor im Lesekopf 22,
z.B. einer Vier-Quadranten-Diode, erkannt, um ein Lesesignal und
weitere Detektorsignale zu erzeugen, darunter Trackingfehler- und
Fokusfehler-Signale für
den Tracking- bzw. Fokussierungs-Aktor. Um die Daten auszulesen,
wird das Lesesignal von Lesemitteln 27 verarbeitet, welche
einen Kanal-Demodulator und einen Fehlerkorrektor umfassen können. Die
ausgelesenen Daten werden zu Datenauswahlmitteln 28 gesendet, um
die komprimierten Audiodaten zum Einspeisen in den Puffer 29 auszuwählen. Die
Auswahl beruht auf Datentyp-Indikatoren, die ebenfalls auf dem Träger aufgezeichnet
sind, z.B. Headern in einem Rahmenformat. Von dem Puffer 29 werden
die komprimierten Audiodaten als ein Signal 30 zu einem
Dekompressor 31 gesendet. Dieses Signal kann außerdem zu einem
externen Dekompressor ausgegeben werden. Der Dekompressor 31 stellt
aus den komprimierten Audiodaten die ursprünglichen Audioinformationen wieder
her und gibt sie am Ausgang 32 aus. Der Dekompressor kann
sich wie in 2 in einem selbstständigen Audio-Digital-Analog-Wandler 33 hoher Qualität befinden.
Stattdessen kann der Puffer auch vor den Datenauswahlmitteln angeordnet
sein. Der Puffer 29 kann in einem separaten Gehäuse untergebracht
sein, oder er kann mit einem Puffer im De kompressor kombiniert sein.
Die Einrichtung weist ferner eine Steuereinheit 20 zum Empfangen
von Steuerbefehlen von einem Benutzer oder von einem nicht dargestellten
Hostcomputer auf, die über
Steuerleitungen 26 mit den Antriebsmitteln 21,
den Positionierungsmitteln 25, den Lesemitteln 27 und
den Datenauswahlmitteln 28 verbunden ist, und möglicherweise
auch mit dem Puffer 29 zur Füllstandsregelung. Zu diesem
Zweck kann die Steuereinheit 20 digitale Steuerschaltungen
umfassen.
-
Die
Technik der Audiokompression und -dekompression ist bekannt. Nach
dem Digitalisieren können
Audiodaten komprimiert werden, indem die Korrelation in dem Signal
analysiert wird und Parameter für
Fragmente einer festgelegten Größe erzeugt
werden. Während
der Dekompression wird der inverse Prozess angewendet, um das ursprüngliche Signal
wiederherzustellen. Wenn das ursprüngliche digitalisierte Signal
exakt wiederhergestellt wird, ist die (De-)Kompression verlustfrei,
während
bei einer verlustbehafteten (De-)Kompression gewisse Details des
ursprünglichen
Signals nicht wiedergegeben werden, welche jedoch für das menschliche
Ohr oder Auge im Wesentlichen nicht wahrnehmbar sind. Die meisten
bekannten Systeme für
Audio und Video, wie etwa MPEG, verwenden eine verlustbehaftete
Kompression, während
für Computerdaten
eine verlustfreie Kompression angewendet wird. Beispiele für die Audio(de)kompression
sind in den unten angeführten Dokumenten
D2, D3 und D4 zu finden.
-
Die
Datenauswahlmittel 28 gewinnen aus den gelesenen Daten
Steuerinformationen wieder, welche das Transfergeschwindigkeits-Profil
angeben, und verwerfen ferner eventuelle Fülldaten, die während des
Aufzeichnens gemäß dem Geschwindigkeitsprofil
hinzugefügt
worden waren. Wenn die Steuereinheit 20 ein Audiostück von dem
Träger
wiedergeben muss, positionieren die Positionierungsmittel 25 den
Lesekopf auf den Abschnitt der Spur, welcher das TOC enthält. Die
Startadresse und das Geschwindigkeitsprofil für das betreffende Stück werden dann über die
Datenauswahlmittel 28 aus dem TOC abgerufen. Stattdessen
kann der Inhalt des TOC auch nur einmal gelesen und in einem Speicher
gespeichert werden, wenn die Platte in das Gerät eingelegt wird. Zum Wiedergeben
des Stückes
versetzen die Antriebsmittel 21 den Aufzeichnungsträger mit der
Geschwindigkeit in Rotation, die durch das Geschwindigkeitsprofil
angegeben ist. Die erforderliche Drehzahl kann als solche in dem
Geschwindigkeitsprofil zum Einstellen der Antriebsmittel verzeichnet
sein. Stattdessen kann das Geschwindigkeitsprofil auch eine Bitrate
enthalten, und dann kann die Drehzahl aus der radialen Position
des Stückes,
ausgehend von der Startadresse, berechnet werden, da die Dichteparameter
des Auf zeichnungsträgers,
wie Spurabstand und Bitlänge,
vorgegeben und der Abspieleinrichtung bekannt sind, gewöhnlich aus
einem Standard. Danach kann die Drehzahl aus der Bitrate und der
besagten radialen Position abgeleitet werden.
-
Um
eine kontinuierliche Wiedergabe ohne Pufferunterlauf oder -überlauf
sicherzustellen, ist die Transfergeschwindigkeit mit der Wiedergabegeschwindigkeit
des D/A-Wandlers gekoppelt, d.h. mit der Bitrate nach der Kompression.
Das Gerät
kann zu diesem Zweck eine Referenzfrequenzquelle aufweisen, um den
Dekompressor zu steuern, und die Drehzahl kann in Abhängigkeit
von der Referenzfrequenz und dem Geschwindigkeitsprofil eingestellt werden.
Die Drehzahl kann auch unter Verwendung des durchschnittlichen Füllstandes
des Puffers 29 eingestellt werden, z.B. indem die Drehzahl
verringert wird, wenn der Puffer im Mittel mehr als zu 50% voll
ist.
-
3 zeigt
eine Aufzeichnungseinrichtung zum Schreiben von Informationen auf
einem Träger 11 eines
Typs, welcher (wieder)beschreibbar ist. Während des Schreibens werden
Markierungen, welche die Informationen repräsentieren, auf dem Aufzeichnungsträger ausgebildet.
Die Markierungen können
eine beliebige optisch lesbare Form aufweisen, z.B. die Form von
Bereichen, deren Reflexionskoeffizient sich von dem ihrer Umgebung
unterscheidet, durch Aufzeichnen in Materialien wie etwa Farbstoff,
Legierung oder Phasenumwandlungsmaterial, oder etwa von Bereichen
mit einer Magnetisierungsrichtung, die von der ihrer Umgebung verschieden
ist. Das Schreiben und Lesen von Informationen zum Aufzeichnen auf
optischen Platten und die anwendbaren Regeln für das Formatieren, die Fehlerkorrektur
und die Kanalcodierung sind wohlbekannt, z.B. vom CD-System. Markierungen
können
durch einen Lichtpunkt 23 gebildet werden, der auf der
Aufzeichnungsschicht mittels eines Strahls 24 von elektromagnetischer
Laserstrahlung erzeugt wird. Die Aufzeichnungseinrichtung umfasst ähnliche
Grundelemente, wie sie unter Bezugnahme auf 2 beschrieben
wurden, d.h. eine Steuereinheit 20, Antriebsmittel 21 und
Positionierungsmittel 25, doch sie weist einen anderen
Schreibkopf 39 auf. Die Audioinformationen werden dem Eingang
von Kompressionsmitteln 35 zugeführt, welche in einem separaten Gehäuse angebracht
sein können.
Eine geeignete Kompression wurde in D2, D3 und D4 beschrieben. Die
mit variabler Bitrate komprimierten Audiodaten am Ausgang der Kompressionsmittel 35 werden
zu einem Puffer 36 gesendet. Vom Puffer 36 werden
die Daten zu Kombiniermitteln 37 gesendet, um Fülldaten
und weitere Steuerdaten hinzuzufügen.
Der gesamte Datenstrom wird Schreibmitteln 38 zum Aufzeichnen
zugeführt.
Der Schreibkopf 39 wird von den Schreibmitteln 38 gespeist,
welche einen For matierer, einen Fehlercodierer und einen Kanalmodulator umfassen
können.
Die Daten, die dem Eingang der Schreibmittel 38 zugeführt werden,
werden entsprechend Formatierungs- und Codierungsregeln über logische
und physikalische Sektoren verteilt und in ein Schreibsignal für den Schreibkopf 39 umgewandelt. Die
Steuereinheit 20 ist dazu bestimmt, den Puffer 36,
die Datenkombiniermittel 37 und die Schreibmittel 38 über Steuerleitungen 26 zu
steuern und den Positionierungsvorgang auszuführen, wie oben für das Lesegerät beschrieben
wurde. Das Aufzeichnungsgerät
kann ebenfalls ein Lesen ermöglichen, indem
es die Merkmale eines Abspielgerätes
und eines kombinierten Lese-Schreibkopfes aufweist.
-
4 zeigt
ein Dateisystem zur Verwendung bei der Erfindung, für welches
im Prinzip mehrere verschiedene Optionen realisierbar sind. Vorzugsweise
sollte das Speichermedium auf dem UDF oder auf dem ISO 9660 Dateisystem
beruhen. In einem alternativen Fall wäre kein Dateisystem vorhanden, und
alle relevanten Sektorräume
müssten
frei gehalten werden.
-
Falls
jedoch ein Dateisystem vorhanden ist, werden alle Audiodaten in
Audiodateien gespeichert, die sich in einem Unterverzeichnis SCD_AUDIO
befinden. 4 zeigt die Hierarchie, die
auf einer Datei ROOT 50 zu basieren ist, die auf verschiedene
untergeordnete Dateien 52, 54, 56, 67 zeigt.
Die Struktur der miteinander identischen MASTER.TOCs (Haupt-Inhaltsverzeichnisse) 52 wird
weiter unten erläutert.
Ferner ist eine Datei 2C_AUDIO 54 vorhanden. Diese zeigt
auf miteinander identische Area TOCs (Bereichs-Inhaltsverzeichnisse) 2C_AREA1/2.TOC 58, 59,
parallel dazu auf verschiedene Stereotracks TRACKn.2CH 60 und
außerdem auf
eine Area-Datei (Bereichsdatei) 2C_TAREA.2CH 61. Ferner
ist eine Datei MC_AUDIO 56 vorhanden. Diese zeigt auf miteinander
identische TOCs (Inhaltsverzeichnisse) MC.TOC 62, 63,
parallel dazu auf verschiedene Mehrkanaltracks TRACKn.MCH 64 und außerdem auf
eine Area-Datei
(Bereichsdatei) MC_TAREA.MCH 65. Demzufolge kann auf die Tracks
entweder über
die zugehörigen
TOCs zugegriffen werden, oder über
ein Dateisystem, welches TOC und Unter-TOCs als Verzeichnisse hat.
Die Dateien 60, 64 beziehen sich jeweils nur auf
die Audioinformationen der zugehörigen
Tracks, doch die Dateien 61, 65 zeigen ebenso
auch auf die Pausenintervalle der zugehörigen Tracks, wie weiter unten
unter Bezugnahme auf 6 erläutert wird. Schließlich kann
das Dateielement 67 gespeicherte Bildinformationen anzeigen.
-
5 zeigt
eine beispielhafte Speicheranordnung zur Verwendung bei der Erfindung,
welche als eine einzige Reihenanordnung dargestellt wurde. Entlang
der horizontalen Achse sind die folgenden Elemente zu erkennen.
Element 120 ist ein Lead-in, welches verwendet wird, um
eine Leseeinrichtung und den Antrieb des Mediums miteinander zu
synchronisieren. Das Dateisystem 122 stellt das dar, was in
Verbindung mit 4 beschrieben wurde. Das Element
Haupt-TOC (Haupt-Inhaltsverzeichnis) 124 kann nach Standardprozeduren
konfiguriert sein und gehört
zu den nachfolgenden Elementen Stereo-Bereich 126 und dem
Element Mehrkanal-Audio 128 und, falls erforderlich, auch
zu dem Element Zusatzdaten 130. Die Längen dieser drei Bereiche brauchen nicht
standardisiert zu werden, da mehrere verschiedene Mengen an Information
vorhanden sein können.
Was die Audio-Bereiche betrifft, so umfassen sie sowohl die eigentlichen
Audiotrack-Bereiche als auch die zugehörigen SUB-TOCs (Unter-Inhaltsverzeichnisse).
Mit Ausnahme der nachfolgend gegebenen Beschreibung kann der Inhalt
der Elemente 126, 128, 130 entsprechend
herkömmlichen
Standards definiert sein, welche an sich keinen Bestandteil der Erfindung
darstellen. Im Allgemeinen können
die zwei Audio-Bereiche dieselbe Struktur aufweisen und dieselben
Arten von Informationen enthalten, mit der Ausnahme, dass sie unterschiedliche
Definitionen für
die verschiedenen Kanäle
aufweisen. Die Audiodaten können
einfach codiert oder verlustfrei codiert sein. Alle Arten von Audiodaten
können
mit ergänzenden
Daten gemultiplext sein, wie etwa CD-Text.
-
Das
Element 130 repräsentiert
Zusatzdaten-Informationen, welche in einem herkömmlichen Standard definiert
sein können.
Die Lead-out-Informationen 132 werden insbesondere für Suchvorgänge verwendet.
Ihre Tracks enthalten keine anderen Informationen als Track-Nummern
und -Adressen. Die Anzahl der Lead-out-Tracks kann einen Ring von etwa
0,5 bis 1 Millimeter Breite bedecken. Gemäß dem Obigen kann auf die gespeicherten
Informationen entweder über
das Dateisystem zugegriffen werden, das im Element 122 festgelegt
ist, oder über
die TOC-Struktur, die im Element 124 festgelegt ist.
-
Die
einzige oder jede beliebige der mehreren Haupt-TOCs 124 beginnt
bei einer jeweiligen einheitlich standardisierten Offset-Position
vom Anfang des Lead-in-Bereiches
aus, wie etwa bei der Byte-Nummer 500 für das erste Haupt-TOC. Bei
dieser Ausführungsform
umfasst ein Haupt-TOC nur einen Sektor von standardmäßiger Größe und enthält in erster
Linie Zeiger auf die verschiedenen Unter-TOCs oder Bereichs-TOCs,
die weiter unten beschrieben werden. Eine bevorzugte Syntax des
Haupt-TOC ist folgende:
- 1. Eine aus 16 Bytes
bestehende Signature (Signatur) identifiziert ein Haupt-TOC, wie
etwa durch "SACD
Master TOC". Die
Signatur enthält
drei Leerzeichen; die Apostrophe sind nicht Teil der Definition.
- 2. Eine aus 2 Bytes bestehende Spec_version (Versionsangabe)
gibt die Versionsnummer des für
die Platte verwendeten Formats an.
- 3. Ein aus 14 Bytes bestehender Space (Zwischenraum) wurde reserviert,
wie etwa für
Fülldaten
zur Synchronisation.
- 4. Eine aus 4 Bytes bestehende ganzzahlige 2CH-start_address
enthält
die logische Adresse des ersten Sektors des Stereo-Bereiches.
- 5. Eine aus 4 Bytes bestehende ganzzahlige 2CH-end_address enthält die logische
Adresse des letzten Sektors des Stereo-Bereiches.
- 6. Eine aus 4 Bytes bestehende ganzzahlige MC-start_address
enthält
die logische Adresse des ersten Sektors des Mehrkanal-Bereiches.
- 7. Eine aus 4 Bytes bestehende ganzzahlige MC-end_address enthält die logische
Adresse des letzten Sektors des Mehrkanal-Bereiches.
- 8. Eine aus 4 Bytes bestehende ganzzahlige Extra_data_start_address
enthält
die logische Adresse des ersten Sektors des Zusatzdaten-Bereiches.
- 9. Eine aus 4 Bytes bestehende ganzzahlige Extra_data_end_address
enthält
die logische Adresse des letzten Sektors des Zusatzdaten-Bereiches.
-
Die
Informationen für
das Obige umfassen insgesamt 56 Bytes. Zusätzliche Merkmale können zu
dem Haupt-TOC hinzugefügt
werden. Falls ein bestimmter Bereich nicht vorhanden ist, haben
die zugehörige
Anfangs- und Endadresse den Wert null.
-
Danach
enthalten die Elemente 126 und 128 Unter-TOCs
oder Bereichs-TOCs
für die
Stereo- bzw. Mehrkanal-Audio-Intervalle. Eine bevorzugte Syntax eines
Unter-TOC ist folgende:
- 1. Eine aus 16 Bytes
bestehende Signature (Signatur) identifiziert das betreffende Unter-TOC, wie etwa durch "SACD Stereo-TOC" für einen
Stereo-Audio-Bereich und "SACD
MC TOC" für einen Mehrkanal-Audio-Bereich,
wobei die Anzahl der Bytes erreicht wird, indem am Ende Leerzeichen hinzugefügt werden.
- 2. Eine aus 2 Bytes bestehende Spec_version (Versionsangabe)
gibt die Versionsnummer des für
die Platte verwendeten Formats an.
- 3. Eine aus 4 Bytes bestehende Sub_TOC_length (Unter-Inhaltsverzeichnis-Länge) gibt
die Anzahl der in dem aktuellen TOC vorhandenen Bytes an.
- 4. Ein aus 10 Bytes bestehender Space (Zwischenraum) kann für Fülldaten
zur Synchronisation reserviert werden.
- 5. Eine Menge von/* Disc Parameters */(Platten-Parameter) von
variabler Größe kann
angegeben werden, wie etwa ein Name eines Albums() und ein Name
eines Katalogs().
- 6. Eine aus 4 Bytes bestehende disc_play_time (Platten-Abspielzeit)
gibt die gesamte lineare Abspielzeit der Platte an, ausgedrückt als
ein Zeitcode.
- 7. Ein aus 4 Bytes bestehender disc_name_pointer (Plattennamen-Zeiger)
gibt den Offset (Versatz) in Bytes vom Anfang des betreffenden Unter-TOC
bis zum Anfang des Feldes disc_name() (Plattenname) an. Falls dieser
Wert 0 ist, zeigt dies an, dass das Feld disc_name() nicht vorhanden
ist.
- 8. Ein aus 4 Bytes bestehender disc_date_pointer (Plattendatums-Zeiger)
gibt den Offset in Bytes vom Anfang des betreffenden Unter-TOC bis
zum Anfang des Feldes disc_date() (Plattendatum) an. Falls dieser
Wert 0 ist, zeigt dies an, dass das Feld disc_date() nicht vorhanden
ist.
- 9. Ein aus 4 Bytes bestehender dise_copyright_pointer (Platten-Copyright-Zeiger) gibt
den Offset in Bytes vom Anfang des betreffenden Unter-TOC bis zum
Anfang des Feldes disc_copyright() (Platten-Copyright) an. Dieser Wert
kann 0 sein, was anzeigt, dass das Feld disc_copyright() nicht vorhanden
ist.
- 10. Ein aus 4 Bytes bestehender dise_publisher_pointer (Platten-Herausgeber-Zeiger)
gibt den Offset in Bytes vom Anfang des betreffenden Unter-TOC bis
zum Anfang des Feldes disc_publisher() (Platten-Herausgeber) an.
Dieser Wert kann 0 sein, was anzeigt, dass das Feld disc_publisher()
nicht vorhanden ist.
- 11. Eine Track_List() von variabler Größe kann für jeden von mehreren Audiotracks
Offset-Informationen bezüglich
des betreffenden TOC enthalten, sowie verschiedene weitere Elemente,
die für
einen Hörer
von Interesse sein können,
wie etwa den Namen des Tracks.
Eine Track_List_1 enthält:
- 12. Eine aus 8 Bytes bestehende Track_List_1_Signature, die
den Sektor mit Track_List_1 identifiziert.
- 13. Eine aus 4 Bytes bestehende Track_Start_Address (tno) (Track-Anfangsadresse)
für alle
Audiotracks mit der Track-Nummer tno in dem aktuellen Audio-Bereich,
welche die logische Adresse des ersten Sektors des Tracks enthält.
- 14. Eine aus 4 Bytes bestehende Track_length (tno) (Track-Länge) für alle Audiotracks
mit der Track-Nummer tno in dem aktuellen Audio-Bereich, welche
die Länge
des Tracks in Sektoren enthält.
Eine
Track_List_2 enthält:
- 15. Eine aus 8 Bytes bestehende Track_List_2_Signature, die
den Sektor mit Track_List_2 identifiziert.
- 16. Einen Track_Start_Time_Code (tno) für alle Audiotracks mit der
Track-Nummer tno, welcher den Anfangs-Time_Code (Zeitcode) des Tracks angibt.
- 17. Eine Track_Time_Length (tno) für alle Audiotracks mit der
Track-Nummer tno, welche die Abspielzeit des Tracks angibt.
-
6 zeigt
eine detaillierte Track-Organisation, insbesondere im Hinblick auf
die zwei Kategorien von Dateien 60, 64 im Vergleich
mit 61, 65. In diesem Beispiel enthält der Speicherbereich
vier Audiotracks 140, 142, 144, 146.
Jeder Track enthält
eine Menge A von Audioinformationen, deren Länge unterschiedlich sein kann.
Ferner ist jedes Paar von aufeinanderfolgenden Audiointervallen
durch ein Pausenintervall getrennt, das mit P gekennzeichnet ist.
Die Längen
der Pausen wurden vom Entwickler des Aufzeichnungsträgers eingestellt
und wurden möglicherweise
unter Berücksichtigung
des speziellen Charakters des vorhergehenden Tracks und/oder des
nachfolgenden Tracks gewählt.
Die Längen
können
von verschiedenen Gesichtspunkten abhängen, wie etwa von den jeweiligen
Lautstärken,
Schwebungsfrequenzen, Übereinstimmung
oder Unterschieden im Charakter, vom Komponisten und vom Stil, und
müssen
für einen
bestimmten Träger
nicht einheitlich sein. Eine Pause der Länge null ist im Prinzip realisierbar.
Der letzte Track weist im Allgemeinen kein nachfolgendes Pausenintervall
auf.
-
Für jeden
Track A sind die Anfangs-Speicherort-Länge und andere Informationen
in dem Bereichs-TOC des Audiobereiches angegeben, zu dem der Track
gehört.
Der Speicherbereich der Tracks A und der Pausenintervalle P, wie
in 6 durch die Doppelpfeile 148 dargestellt,
enthält
einen Time_Code (Zeitcode). Der Time_Code beginnt am Anfang des
Pausenintervalls P bei null. Der Time_Code wird bis zum Ende des
Speicherbereiches 148 in Schritten von 1/75 Sekunden inkrementiert.
Eine Zeiteinheit von 1/75 Sekunden wird ein Frame (Rahmen) genannt.
Der Time_Code ist in gemultiplexten Frames codiert. Alle Tracks
A sowie alle Pausenintervalle P im Speicherbereich 148 werden durchgehend
nummeriert, beginnend bei eins.
-
Nun
sind, um nur auf einen einzelnen, separaten Track zuzugreifen, wie
etwa für
eine Bearbeitung am Computer oder zum Abspielen in einer beliebigen
Reihenfolge, gewöhnlich
nur die eigentlichen Audioinformationen relevant. In einer solchen
Situation kann eine Wiedergabe auf die Pausen verzichten oder sie
auf eine unabhängige
Weise festlegen. Demzufolge zeigen die Dateien 60, 64 in 4 ausschließlich auf
die Audio-Teile der zugehörigen Tracks,
für sich
genommen. Dies wurde in 6 durch die Doppelpfeile 148 dargestellt,
welche sich ausschließlich über die
Audio-Teile erstrecken. Andererseits besteht ein anderer Verwendungsmodus
darin, den Bereich Sektor für
Sektor abzuspielen. Dies kann im Prinzip geschehen, ohne dass überhaupt Bezugnahme
auf irgendein Dateisystem erfolgt. Die Erfinder sind jedoch zu der
Ansicht gelangt, dass aus Gründen
der Konsistenz ein Dateisystem geeignet wäre, jedoch aus ästhetischen
oder anderen die Wahrnehmung betreffenden Gründen Pausen nicht übersehen
sollte. Daher wurde dem Bereich als Ganzes, einschließlich der
Pausen, eine separate Datei zugewiesen, welche durch die zusätzliche
Angabe 150 symbolisch dargestellt wurde und in den Elementen 61, 65 in 4 enthalten
ist. Das zugehörige
Bereichs-TOC gibt dann die Größen der
betreffenden Pausen an, und wo der nächste Audiotrack beginnt. Das
Obengesagte bedeutet, dass das Zugreifen auf die Audioinformationen
direkt erfolgt, unter Verwendung entweder der Track-Dateien oder,
als Alternative dazu, der umfassenden Datei und der zugehörigen Unter-TOCs.
-
Liste zugehöriger Dokumente:
-
- (D1) Research Disclosure Nr. 36411, August
1994, S. 412–413.
- (D2) PCT/IB97/01156 (PHN 16.452), 1 bit ADC and lossless compression
of audio
- (D3) PCT/IB97/01303 (PHN 16.405), Audio compressor
- (D4) EP-A 402,973 (PHN 13.241), Audio compression
- (D5) J. J. van der Kam, "A
digital decimating filter for analog-to-digital conversion of hi-fi
audio signals", Philips
Techn. Rev. 42, Nr. 6/7, April 1986, S. 230–8.
- (D6) Kirk C. H. Chao et al., "A higher order topology for interpolative
modulators for oversampling A/D converters", IEEE Tr. on Circuits and Systems,
Bd. 37, Nr. 3, März
1990, S. 309–18.
-
Text in der
Zeichnung
-
(Begriffe,
die in der folgenden Liste nicht aufgeführt sind, bleiben unverändert.)
-
Fig. 4
- 67
- BILDER
-
Fig 5
- 120
- Lead-in
- 122
- Dateisystem
- 124
- Haupt-TOC
- 126
- Stereo-Bereich
- 128
- Mehrkanal-Bereich
- 130
- Zusatzdaten-Bereich
- 132
- Lead-out