-
Die vorliegende Erfindung bezieht
sich auf ein Datenanordnungsverfahren und ein Medium zum Aufzeichnen
oder Übertragen
von Daten o.dgl., die auf einer digitalen Videoplatte und einer
digitalen Audioplatte aufzuzeichnen sind, sowie auf eine Signalverarbeitungsvorrichtung
zum Verarbeiten der Daten.
-
In jüngster Zeit sind digitale Videoplatten
als optische Platten zusätzlich
zu den herkömmlichen Compact
Disks (nachstehend als "CDs" bezeichnet) für den Audio-Gebrauch entwickelt
worden, und Abspielgeräte
für solche
digitale Videoplatten sind ebenfalls entwickelt worden. Die digitalen
Videoplatten umfassen im einzelnen eine Art, die in etwa dieselbe
Größe (12 cm
Durchmesser) wie die herkömmlichen
CDs aufweist und so ausgelegt ist, daß etwa zwei Stunden Bildinformation
auf dieser Platte aufgezeichnet und von ihr wiedergegeben werden
können. Für eine solche
digitale Videoplatte gibt es ein Format, das gestattet, Sprechton
oder Musik in acht verschiedenen Sprachen und überlagerte Information in zweiunddreißig verschiedenen
Sprachen auf der gleichen Platte zusätzlich zu der Bildinformation
aufzuzeichnen.
-
Es sind auch digitale Videoplatten,
die Sprechton oder Musik in mehreren Sprachen zusätzlich zu
der Hauptbild-Information
aufzeichnen können
und die gleiche Größe aufweisen
wie die herkömmlichen
CDs, entwickelt worden. Falls solche digitale Videoplatten auf dem
Markt verfügbar
werden, wäre
es selbstverständlich
ein natürliches
Bedürfnis, Musikstücke oder
Stimmpassagen (Audiosignale) von neuen digitalen Videoplatten ebenso
wie von den herkömmlichen
CDs zu reproduzieren bzw. wiederzugeben. Die Aufzeichnungssysteme
für Audiosignale
umfassen ein Kompressionssystem und ein lineares PCM-System. Wenn
man eine Videoplatte in Betracht zieht, von der Audiosignale von
Musikstücken und
Stimmpassagen durch einen ausschließlichen Audio-Player wiedergegeben
werden können,
ist es effektiv, Daten durch die lineare PCM-Technik, wie sie für die herkömmlichen
CDs verwendet wird, aufzuzeichnen. Höchstwahrscheinlich werden sowohl minderklassige
als auch hochklassige Arten von Videoplattenspielern auf dem Markt
verfügbar.
-
Die Dokumente D1 = EP-A-O 795 859
und D2 = EP-A-O 797 199, die unter Art. 54(3) EPÜ fallen, offenbaren ein Verfahren
zum Aufzeichnen von digitalen Mehrkanal-Audiodaten, wobei Abtastdaten
jedes Kanalssignals in ein aus MSBs bestehendes Hauptwort und ein
aus LSBs bestehendes Zusatzwort aufgeteilt werden. Eine Sammlung
von Hauptwörtern
einzelner Kanäle
wird als Haupt-Abtastwert und eine Sammlung von Zusatzwörtern als
Zusatz-Abtastwert angeordnet. Die Haupt- und Zusatz-Abtastwerte zweier aufeinanderfolgender
Zeitpunkte werden als Paare angeordnet.
-
Demgemäß ist es eine Aufgabe der vorliegenden
Erfindung, ein Datenanordnungsverfahren und einen Träger für die Datenaufzeichnung
oder Datenübertragung
bereitzustellen, die bei der Aufzeichnung oder Bearbeitung von Daten
o.dgl. eines linearen PCM-Systems wirksam sind, und die Mehrkanalsignale
von höherer
Qualität
als die von herkömmlichen
CDs aufzeichnen können
und sowohl unterklassigen als auch hochklassigen Maschinen ermöglichen,
einen Reproduktions- bzw.
Wiedergabevorgang einfach auszuführen,
und eine Signalverarbeitungsvorrichtung zum Verarbeiten solcher
Daten.
-
Um die obige Aufgabe zu erfüllen, wird
ein Verfahren zum Aufzeichnen oder Übertragen quantisierter Daten
bereitgestellt, die durch Abtasten eines Kanalsignals oder Mehrkanalsignals
in einer zeitlich sequentiellen Art und Weise gemäß Anspruch
1 erhalten werden.
-
Mit der obigen Struktur wird eine
Reproduktionsschaltung einfach in einer niederklassigen Maschine
aufgebaut, die nur Hauptwörter
oder nur zwei Kanäle
von Hauptwörtern
reproduziert, während
eine Reproduktionsschaltung für Zusatzwörter bei
einer hochklassigen Maschine nur der Hauptwort-Reproduktionsschaltung
hinzuzufügen
ist.
-
Diese Erfindung ist aus der folgenden
detaillierten Beschreibung in Zusammenhang mit den beigefügten Zeichnungen
besser verständlich,
in denen zeigen:
-
1A bis 1D erläuternde Diagramme zur Darstellung
einer Abtaststruktur und der Anordnung von Abtastwerten für die Erklärung einer
grundlegenden Ausführungsform
dieser Erfindung,
-
2 eine
erläuternde
Darstellung zur Veranschaulichung einer Beziehung zwischen den Abtastwerten
in
-
1D,
einem Frame und einer Gruppe,
-
3A und 3B erläuternde Darstellungen einer
Beziehung zwischen einem Audioframe und einer Sequenz von Packs
gemäß dieser
Erfindung,
-
4A und 4B Darstellungen allgemeiner Audiodatenanordnungen
in einem 20-Bit-Mode und einem 24-Bit-Mode,
-
5 eine
erläuternde
Darstellung des Prinzips der Verschachtelung,
-
6A und
6BB erläuternde
Darstellungen eines Beispiels der Anordnung von Packs und der Struktur
eines Audiopacks in dieser Anordnung gemäß dieser Erfindung,
-
7 eine
erläuternde
Ansicht zur Darstellung der detaillierten Struktur eines Audio-Packs,
-
8 eine
erläuternde
Ansicht zur beispielhaften Darstellung einer Liste von Größen linearer PCM-Daten in einem Paket,
an das diese Erfindung angepaßt
ist,
-
9 eine
erläuternde
Ansicht zur Darstellung von Generierungsprozeduren eines Audio-Packs,
-
10 ein
strukturelles Blockdiagramm eines Platten-Abspielgeräts,
-
11 eine
erläuternde
Ansicht einer Plattenlaufwerksektion, 12 eine
erläuternde
Ansicht einer optischen Platte,
-
13 eine
erläuternde
Ansicht zur Darstellung des logischen Formats einer optischen Platte,
-
14 eine
erläuternde
Ansicht eines Videomanagers in 9,
-
15 eine
erläuternde
Ansicht eines Videoobjektsatzes in 8,
-
16 eine
erläuternde
Ansicht einer Programmkette,
-
17 ein
Diagramm zur Darstellung eines Beispiels der Basis-Schaltungsstruktur
eines Audio-Decoders gemäß dieser
Erfindung,
-
18 eine
Ansicht zur Darstellung eines weiteren Beispiels der Basis-Schaltungsstruktur
des Audio-Decoders,
-
19 eine
Ansicht zur Darstellung eines weiteren Beispiels der Basis-Schaltungsstruktur
des Audio-Decoders,
-
20 eine
Ansicht zur Darstellung eines noch anderen Beispiels der Basis-Schaltungsstruktur des
Audio-Decoders,
-
21 eine
Tabelle zur Darstellung des Inhalts des Pack-Headers des Audio-Packs,
-
22 eine
Tabelle zur Darstellung des Inhalts des Paket-Headers des Audio-Packs,
-
23 ein
Blockdiagramm, das hauptsächlich
das Audiodaten-Verarbeitungssystem zeigt, das in das Plattenwiedergabegerät eingegliedert
ist,
-
24A bis 24D Ansichten zur Darstellung einer
Platte, einer Pit-Abfolge, einer Sektor-Abfolge bzw. eines physischen
Sektors,
-
25A und 25B jeweils ein Diagramm zur Darstellung
eines physischen Sektors und einer Tabelle, welche den Inhalt des
physischen Sektors darstellt,
-
26A und 26B Ansichten zur Darstellung der
Struktur eines aufzuzeichnenden/aufgezeichneten Sektors, und
-
27A und 27B Ansichten zur Darstellung eines
Fehlerkorrektur-Codeblocks.
-
Im folgenden werden bevorzugte Ausführungsformen
der vorliegenden Erfindung unter Bezugnahme auf die beigefügten Zeichnungen
beschrieben.
-
Zunächst wird eine Datenanordnung
durch das lineare PCM-System
in dem Datenaufzeichnungssystem gemäß dieser Erfindung erläutert. Man beachte,
daß 16
Bits, 20 Bits oder 24 Bits beispielsweise willkürlich als Quantisierungsbits
bei linearen PCM-Daten verwendet werden. Ferner umfassen Audio-Moden monaurale Moden,
Stereo-Moden, 3-Kanal-, 4-Kanal-, 5-Kanal-, 6-Kanal-, 7-Kanal- und 8-Kanal-Moden.
-
Es wird davon ausgegangen, daß es acht Kanäle (A bis
H) von Audiosignalen gibt. Diese Audiosignale werden mit einer Abtastfrequenz
von 48 KHz oder 96 KHz abgetastet, um quantisiert zu werden. Im
folgenden wird ein Beispiel beschrieben, bei dem die Quantisierungsbits
20 Bits sind.
-
1A zeigt,
wie acht Kanäle
von Audiosignalen A bis H abgetastet werden. Es wird angenommen,
daß jeder
Abtastwert auf beispielsweise 20 Bits quantisiert. wird. Es ist
auch dargestellt, daß jeder Abtastwert
von 20 Bits in ein Hauptwort und ein Zusatzwort unterteilt ist.
-
Die Hauptwörter der einzelnen Kanäle sind durch
Großbuchstaben
des Alphabets plus ein Suffix "n" angegeben, und die Extra- bzw.
Zusatzwörter sind
durch Kleinbuchstaben des Alphabets plus das Suffix "n" angegeben,
wobei n (= 0, 1, 2, 3, ...) die Abtastreihenfolge angibt. Jedes
Hauptwort besteht aus 16 Bits und jedes Zusatzwort besteht aus 4
Bits.
-
Einzelne Abtastwerte werden in Form
von A0a0, A1a1, A2a2, A3a3, A4a4 usw. für das Signal A, B0b0, B1b1,
B2b2, B3b3, B4b4 usw. für
das Signal B, C0c0, C1c1, C2c2, C3c3, C4c4 usw. für das Signal
C, ..., und H0h0, H1h1, H2h2, H3h3, H4h4 usw. für das Signal H erzeugt.
-
1B stellt
das obige Wortanordnungsformat als eine Sequenz von Abtastwerten
für den
Fall dar, bei dem diese Wörter
auf einem Aufzeichnungsmedium aufgezeichnet sind.
-
Zunächst werden alle Abtastdaten,
die aus 20 (=M) Bits bestehen, in ein Hauptwort von 16 (=m1) Bits
auf der MSB-Seite
und ein Zusatzwort von 4 (=m2) Bits auf der LSB-Seite unterteilt.
Als nächstes werden
die Null-ten (= 2n-ten) Hauptwörter
in den einzelnen Kanälen
kollektiv angeordnet. Dann werden die ersten (= (2n + 1)-ten) Hauptwörter in
den einzelnen Kanälen
kollektiv angeordnet. Dann werden die null-ten (=2n-ten) Zusatzwörter in
den einzelnen Kanälen
kollektiv angeordnet. Dann werden die ersten (= (2n + 1)-ten) Zusatzwörter in
den einzelnen Kanälen
kollektiv angeordnet. Man beachte, daß n = 0, 1, 2, ...
-
Eine Gruppe von Hauptwörtern in
den einzelnen Kanälen
ist ein Hauptabtastwert. Ebenso ist eine Gruppe von Zusatzwörtern in
den einzelnen Kanälen ein
Zusatz-Abtastwert.
-
Bei Anwendung eines solchen Formats
sollte ein Datenreproduktionsverfahren durch eine kostengünstige Maschine
(z. B. eine, die im 16-Bit-Modus arbeitet) nur Hauptwörter behandeln,
während
ein Datenreproduktionsprozeß durch
eine kostspielige Maschine (z. B. eine, die in einem 20-Bit-Modus arbeitet)
sowohl Hauptwörter
als auch ihre zugeordneten Zusatzwörter behandeln sollte.
-
1C zeigt,
wie einzelne Abtastwerte unter Verwendung der spezifischen Bitnummern
für den Hauptabtastwert
und den Zusatz-Abtastwert angeordnet werden.
-
In der Form von solchen quantisierten
linearen PCM-Codes kann die Trennung eines 20-Bit-Abtastwerts in
ein 16-Bit-Hauptwort
und ein 4-Bit-Zusatzwort folgendes ermöglichen. Die Maschine, welche
im 16-Bit-Mode arbeitet, kann einfach unnötige Abschnitte durch Ausführen einer
Datenverarbeitung in Einheiten von 8 Bits in den Bereichen von Zusatz-Abtastwerten in der
Abtastwertanordnung aussondern bzw. beseitigen. Dies rührt daher,
daß zwei Zusatz-Abtastwerte
4 Bits mal 8 Kanäle
und 4 Bits mal 8 Kanäle
sind, und diese Daten 8 mal hintereinander in den Einheiten von
8 Bits verarbeitet (ausgesondert bzw. beseitigt) werden können.
-
Das Merkmal dieser Datenanordnung
ist nicht auf dasjenige dieser Ausführungsform beschränkt. In
jedem Fall, in dem es eine ungerade Anzahl von Kanälen gibt,
oder indem ein Zusatzwort aus 8 Bits besteht, ist die Gesamtzahl
von Bits zweier aufeinanderfolgender Zusatz-Abtastwerte ein ganzzahliges
Vielfaches von 8 Bits, so daß eine
kostengünstige
Maschine, welche nur Hauptwörter
reproduziert, Zusatz-Abtastwerte überspringen kann, indem ein Ausscheidungsprozeß n aufeinanderfolgende
Male 8 Bits um 8 Bits gemäß dem Modus
ausführt.
-
Daten in dem Zustand in 1B können dann einem Modulationsprozeß unterzogen
werden, um auf einem Aufzeichnungsmedium aufgezeichnet zu werden.
Falls Daten zusammen mit anderer Steuerinformation und Videoinformation
aufzuzeichnen sind, ist es vorzuziehen, daß die Daten in der Form aufgezeichnet
werden, die auf der Zeitbasis einfach gemanagt wird, um eine Datenhandhabung
und Synchronisierung zu erleichtern. In dieser Hinsicht erfolgt die
folgende Frame-Formierung, Gruppierung und Paket-Formierung.
-
1D zeigt
eine Sequenz von Audioframes. Die Einheit von Daten über eine
gegebene Reproduktionszeit beträgt
1/600 sec., was einem Frame entspricht. Einem Frame sind 80 oder
160 Abtastwerte zugeteilt. Mit einer Abtastfrequenz von 48 KHz ist ein
Abtastwert 1/4800 sec. Und (1/48000) mal 80 Abtastwerte = 1/600
sec. Mit einer Abtastfrequenz von 96 KHz ist ein Abtastwert 1/9600
sec. Und (1/96000) x 160 Abtastwerte = 1/600 sec. Offensichtlich
besteht ein Frame aus 80 Abtastwerten oder 160 Abtastwerten.
-
2 zeigt
eine Beziehung zwischen dem vorgenannten einen Frame und einer GOF
(Framegruppe). Ein Frame besteht aus 80 oder 160 Abtastwerten und
stellt Daten von 1/600 sec dar, und eine GOF-besteht aus 20 Frames.
Somit ist eine GOF (1/600) sec x 20 = 1/30 sec, was die Frequenz
eines TV-Frames bzw. -Teilbilds ist. Eine Sequenz von solchen GOF's
ist ein Audiostream. Diese Einheit, GOF, wird bei der Synchronisierung
mit einem Videosignal wirksam. Da dieser Frame zusammen mit anderen Steuersignalen
und Videosignalen aufgezeichnet wird, ist er in Pakete verteilt.
Die Beziehung zwischen diesem Paket und einem Frame wird nachstehend beschrieben.
-
3A zeigt
die Beziehung zwischen dem Paket und dem Frame.
-
DSI ist eine Datensuchinformation,
V ist ein Videoobjekt, A ist ein Audioobjekt und S ist ein Überlagerungsbildobjekt
(sub picture object). Jeder Block wird als Pack bezeichnett. Ein
Pack ist als 2048 Bytes definiert. Ein Pack umfaßt ein Paket und besteht aus
einem Pack-Header, einem Paket-Header und einem Paket. In der DSI
ist Information zum Steuern aller Daten zur Playback-Zeit beschrieben, wie
z. B. die Startadresse und Endadresse jedes Packs.
-
3B zeigt
nur extrahierte Audiopacks. Obwohl DSI-Packs, Videopacks V und Audiopacks A tatsächlich in
der Anordnung gemäß 3A gemischt sind, sind nur
Audiopacks A in 2B dargestellt, um
zum besseren Verständnis
der Beziehung zwischen einem Frame und Packs beizutragen. Gemäß den Standards
dieses Systems ist Information so angeordnet, daß es etwa 0,5 sec. dauert,
um Information zwischen einer DSI und der nächsten DSI zu reproduzieren
bzw. wiederzugeben.
-
Da nach obiger Erläuterung
ein Frame 1/600 sec. ist, bestehen zwischen einer DSI und einer
anderen DSI 30 Audioframes. Die Datenmenge (D) eines Frames variiert
je nach der Abtastfrequenz (fs), der Anzahl von Kanälen (N)
und der Anzahl von Quantisierungsbits (m).
-
Wenn fs = 48 KHz, so ist D = 80 × N × m, und wenn
fs = 96 KHz ist, so ist D = 160 × N × m.
-
Daher muss ein Frame nicht notwendigerweise
einem Pack entsprechen; mehrere Frames oder weniger als ein Frame
können
einem Pack entsprechen. D. h., der Kopf eines Frames kann in die Mitte
eines Packs kommen, wie in 3B gezeigt
ist. Positionsinformation des Kopfs eines Frames ist im Pack-Header beschrieben
und ist als Anzahl von Datenzählungen
(Timings) von dem Pack-Header oder DSI beschrieben. Beim Reproduzieren
bzw. Wiedergeben von Daten von dem vorgenannten Aufzeichnungsmedium
ruft die Wiedergabevorrichtung einen Frame von Audiopacks ab, Zusatzhiert
Daten eines zu reproduzierenden Kanals und liefert die Daten dem
Audio-Decoder, um
einen Deeodiervorgang auszuführen.
-
4A stellt
die Beziehung zwischen einem Hauptwort (16 Bits) und einem Zusatzwort
(4 Bit) im 20-Bit-Mode dar, wobei sie allgemein die vorgenannte
Datenanordnung zeigt, und
-
4B veranschaulicht
die Beziehung zwischen einem Hauptwort (16 Bits) und einem Zusatzwort
(8 Bits) im 24-Bit-Mode.
-
Gemäß den 4A und 4B weisen
Abtastdaten die vorgenannte Frame-Struktur und Pack-Struktur mit
einem ganzzahligen Vielfachen von Doppelpaaren von Abtastwerten
auf, wobei jedes Paar aus einem Haupt-Abtastwert und einem Zusatz-Abtastwert
besteht.
-
Die vorstehende Beschreibung ist
davon ausgehend gegeben worden, daß kein Verschachtelungsverfahren
im Signalformat ausgeführt
wird. Wenn ein Kratzer auf einem Aufzeichnungsmedium vorhanden ist
oder aufeinanderfolgende Datenausfälle während der Datenübertragung
vorkommen, kann eine Verschachtelung, falls sie ausgeführt wurde,
die aufeinanderfolgenden Signalverluste reduzieren. Es ist bekannt,
daß diese
Verschachtelung eine annähernde
Interpolation von verlorengegangenen Abtastdaten ermöglichen
kann.
-
5 stellt
das Prinzip des Verschachtelns (interleaving) und "Entschachtelns"
(deinterleaving) für
das oben beschriebene Format dar. Gemäß der Datenanordnung dieser
Erfindung kann selbst bei Ausführung
einer Verschachtelung eine billige Maschine nur Hauptwörter einfach
verschachteln. Dies bringt den Vorteil mit sich, daß die Schaltung
vereinfacht werden kann.
-
Dieses Beispiel verwendet eine Verzögerungs-Verschachtelungstechnik
mit einer Verschachtelungslänge
D von 2k Abtastwerten. In der Figur bedeutet S einen Hauptabtastwert,
und die Hauptabtastwerte S0 = A0, B0,... H0, S1 = A1, B1,... H1,
S2 = A2, B2,... H2, und Sj = Aj, Bj, Cj, ... Hj. Der Buchstabe "e"
bedeutet einen Zusatz-Abtastwert,
und Zusatz-Abtastwerte e0 = a0, b0,... h0, e1 = a1, b1, ... h1, e2
= a2, b2,... h2, und ej = aj, bj, cj,... hj. Geradzahlige Haupt-Abtastwerte
werden einem verzögerungslosen Übertragungssystem
L11 eingegeben, und ungeradzahlige Hauptabtastwerte werden in ein
Verzögerungs-Übertragungssystem L12 eingegeben.
Geradzahlige Zusatzabtastwerte werden in ein verzögerungsloses Übertragungssystem
L13 eingegeben, und ungeradzahlige Zusatz-Abtastwerte werden in ein Verzögerungs-Übertragungssystem
L14 eingegeben.
-
Der Verzögerungsbetrag von Zusatzabtastwerten,
von denen jeder aus 4 Bits besteht, kann ein Viertel des Verzögerungsbetrags
von Hauptabtastwerten (16 Bits) betragen, und der Verzögerungsbetrag
von Zusatzabtastwerten, von denen jeder aus 8 Bits besteht, kann
eine Hälfte
des Verzögerungsbetrags
von Hauptabtastwerten (16 Bits betragen. Daher ist das Verzögerungs-Übertragungssystem
L14 so gestaltet, daß es
den Verzögerungsbetrag
zwischen dem 20-Bit-Mode
und dem 24-Bit-Mode schalten kann.
-
Spalten der einzelnen Abtastwerte
auf der Eingabeseite des Übertragungssystems
in 5 behalten das Format
bei, das in Bezug auf Fig. 1B erläutert wurde. Mit den Spalten
synchronisierter Abtastwerte werden die einzelnen Abtastwerte in
die zugeordneten Übertragungssysteme
eingegeben. Im Ergebnis wird eine zweidimensionale Anordnung von Abtastwerten,
wie sie auf der rechten Seite der einzelnen Übertragungssysteme zu erkennen
ist, abgerufen. Obwohl die Dateninhalte von Spalten in der zweidimensionalen
Anordnung sich von denjenigen vor der Verschachtelung unterscheiden,
enthält
diese Anordnung nach wie vor Kombinationen von zwei Hauptabtastwerten
und zwei Zusatzabtastwerten in der Vertikalrichtung.
-
Beim Ausführen des Entschachtelungsprozesses
werden selbst Spalten von Hauptabtastwerten in einen Verzögerungsübertragungspfad
eingegeben, während
ungeradzahlige Spalten von Hauptabtastwerten einem verzögerungslosen Übertragungspfad
eingegeben werden. Auf ähnliche
Weise werden geradzahlige Spalten von Zusatzabtastwerten einem Verzögerungs-Übertragungspfad
eingegeben, während
ungeradzahlige Spalten von Zusatzabtastwerten einem verzögerungslosen Übertragungspfad
eingegeben werden. Diese Bearbeitung kann die ursprüngliche
Abtastwertanordnung liefern. Im 16-Bit-Mode sind nur die Übertragungssysteme für Hauptabtastwerte
zu verwenden.
-
Auf der Reproduktionsseite sollte
eine Maschine, welche nur Hauptabtastwerte reproduziert, eine Entschachtelungs-Schaltung (deinterleave
circuit) aufweisen, die nur Hauptabtastwerte behandelt. Um nur einen
spezifischen Kanal zu reproduzieren, wird eine Entschachtelungsschaltung
verwendet, welche Wörter
in Abtastdaten dieses spezifischen Kanals behandelt.
-
Wie oben beschrieben wurde, kann
diese Erfindung ein Datenanordnungsverfahren und einen Träger zum
Aufzeichnen oder Übertragen
von Mehrkanaldaten des linearen PCM-Systems bereitstellen, was es
ermöglicht,
daß sowohl
niederklassige als auch hochklassige Maschinen einen Reproduktionsprozeß ausführen können, sowie
eine Verarbeitungsvorrichtung, welche solche Daten verarbeitet.
-
6A stellt
beispielhaft die Anordnung von Packs dar, von denen jedes ein Paket
aufweist.
-
DSI ist eine Datensuchinformation,
V ist ein Videoobjekt, A ist ein Audioobjekt und S ist ein Überlagerungsbildobjekt.
Jeder Block wird Pack genannt. Die Größe eines Packs ist auf 2048
Bytes festgelegt. Ein Pack umfaßt
ein Paket und besteht aus einem Pack-Header, einem Paket-Header
und einer Paket-Datensektion. Im DSI ist Information zum Steuern aller
Daten zur Playback-Zeit, wie z. B. die Startadresse und Endadresse
jedes Packs beschrieben.
-
6B zeigt
nur extrahierte Audiopacks A. Obwohl DSI-Packs, Video-Packs und Audio-Packs tatsächlich in
der Anordnung gemäß 6A gemischt sind, sind in 6B nur Audio-Packs dargestellt,
um zum Verständnis
von, Packs beizutragen. Die Standards dieses Systems definieren,
daß der Betrag
bzw. die Menge an Information, die zwischen DSIs angeordnet ist,
etwa 0,5 sec äquivalent
sein sollte, wenn Information zwischen DSIs reproduziert bzw. wiedergegeben wird.
Wie oben erwähnt
wurde, besteht ein Pack aus einem Pack-Header, einem Paket-Header
und einer Paket-Datensektion.
-
Im Pack-Header und dem Paket-Header
ist Information beschrieben, die zum Reproduzieren bzw. Wiedergeben
von Audiodaten notwendig ist, wie z. B. die Größe eines Audiopacks, ein Präsentations-Zeitprotokoll
zum Synchronisieren mit der Reproduktionsausgabe von Videodaten,
ein Identifizierungscode (ID) eines Kanals (stream) Quantisierungsbits,
eine Abtastfrequenz und eine Startadresse und Endadresse von Daten.
-
Audiodaten, die in dieses Paket eingefügt sind,
weisen Doppelpaare von Abtastwerten auf, wobei, jedes Paar aus zwei
Hauptabtastwerten und zwei Zusatzabtastwerten gemäß 1A bis 1C besteht.
-
7 zeigt
ein Audio-Pack-in Vergrößerung. Im
Datenbereich dieses Audio-Packs sind doppelte Paare von Abtastwerten
angeordnet, wobei das obere Doppelpaar von Abtastwerten (A0-H0,
A1-H1) am Kopf bzw. Anfang des Datenbereichs gelegen ist. Die Anzahl
von Bytes in einem Pack ist auf 2048 Bytes festgelegt. Da Abtastwerte
Daten mit variabler Länge sind,
sind 2048 Bytes nicht notwendigerweise gleich einem ganzzahligen
Vielfachen der Bytelänge
von zwei Paaren von Abtastwerten. Daher kann sich ein Fall ergeben,
bei dem die maximale Bytelänge
eines Packs sich von der Bytelänge
von (Doppelpaar von Abtastwerten x ganze Zahl) unterscheidet. In
diesem Fall ist die Bytelänge
eines Packs so eingestellt, daß die
Bytelänge
des Packs ? (Doppelpaar von Abtastwerten x ganze Zahl) wird. Falls
ein Teil eines Packs übrig
bleibt, wird ein Stopfbyte in den Pack-Header eingefügt, wenn
der Rest gleich oder weniger ist als 7 Bytes, während ein Auffüllpaket
(padding packet) am Ende des Packs eingefügt wird, wenn der Rest 7 Bytes überschreitet.
-
Audioinformation bei diesem Packformat kann
zur Zeit der Reproduktion bzw. Wiedergabe einfach gehandhabt werden.
-
Da die vorderen Audiodaten in jedem
Pack das vordere Doppelpaar von Abtastwerten oder Hauptabtastwerten
ist, wird der Reproduktionsprozeß einfacher, wenn die Reproduktion
bzw.
-
Wiedergabe mit dem geeigneten Timing
ausgeführt
wird. Dies kommt daher, daß die
Wiedergabevorrichtung Pack um Pack Daten abruft und eine Datenverarbeitung
ausführt.
Falls Abtastwerte von Audiodaten über zwei Packs hinweg gelegen
sind, sind die zwei Packs abzurufen und die Audiodaten nach der
Integrierung zu decodieren. Dies kompliziert die Verarbeitung, wenn
die vorderen bzw. anfänglichen Audiodaten
in jedem Pack immer das vordere Doppelpaar von Abtastwerten ist
und Audiodaten Pack um Pack wie bei dieser Erfindung gruppiert sind,
sollte ein Timing nur für
ein Pack vorgenommen werden, womit die Datenverarbeitung erleichtert
wird. Ferner vereinfacht die Paket-um-Paket-Datenverarbeitung das
Autorensystem (Hilfssystem), welches die Software zur Verarbeitung
von Daten vereinfachen kann.
-
Bei einer speziellen Wiedergabe o.dgl.
können
Videodaten einem Ausdünnen
oder einer Interpolation unterzogen werden. In einem solchen Fall
ist es möglich,
da Audiodaten Paket um Paket behandelt werden können, das Reproduktions-Timing
relativ einfach zu steuern. Ferner muss Software für die Decoder
nicht kompliziert sein. Zwar werden Abtastwerte in dem oben beschriebenen
System so generiert, daß jeder
Abtastwert in die, oberen 16 Bits und die unteren 4 Bits unterteilt
ist, Daten müssen
jedoch nicht notwendigerweise ein solches Format annehmen, solange
lineare PCM-Audiodaten abgetastet werden.
-
Mit der Datenlänge eines Zusatz-Abtastwerts
gleich 0 wird beispielsweise eine Abfolge von Daten, eine Sequenz
von Hauptabtastwerten, was das allgemeine Datenformat ist. In diesem
Fall sind keine Zusatz-Abtastwerte vorhanden, so daß kein Bedarf
besteht, Doppelpaare von Abtastwerten zu erzeugen, und es sind nur
Hauptabtastwerte in Pakete umzuformen.
-
8 zeigt
eine Liste der Größen linearer PCM-Daten,
wenn lineare PCM-Daten in einem Paket in den Einheiten von Doppelpaaren
von Abtastwerten nach obiger Erläuterung
angeordnet sind bzw. werden. Die Datengrößen sind als die Anzahl von
Maximal-Abtastwerten dargestellt, die in ein Pack separat für die monauralen
(mono), Stereo und Multikanal-Moden
einzusetzen sind. Jede Gruppe zeigt die Datengrößen für die betreffenden Anzahlen von
Quantisierungsbits. Da Doppelpaare von Abtastwerten als Einheiten
genommen werden, ist jede Anzahl von Abtastwerten in einem Paket
eine gerade Zahl. Bei steigender Anzahl von Kanälen erhöht sich die Anzahl von Bytes
dementsprechend, so daß die Anzahl
von Abtastwerten in einem Paket abnimmt. Wenn die Anzahl von Quantisierungsbits
16 Bits beträgt
und der Mode der monaurale Mode ist, beträgt die Anzahl von Abtastwerten
in einem Paket 1004, und die Anzahl von Bytes 2008 mit dem Stopfbyte von
5 Bytes, was angibt, daß es
keine Füllbytes
gibt. Es ist jedoch anzumerken, daß das erste Paket Stopfbytes
von 2 Bytes aufweist. Dies liegt daran, daß 3-Byte-Attributinformation
an den Header des ersten Pakets angefügt werden kann.
-
Bei einer Anzahl von Quantisierungsbits
von 24 Bits und im Stereo-Mode wird das vordere Paket mit 6 Stopfbytes
versehen und die nachfolgenden Pakete mit 9 Füllbytes versehen.
-
9 veranschaulicht
die Arbeitsgänge
der Vorrichtung, welche Packs erzeugt.
-
Man nehme an, daß Audiosignale jedes Kanals
Abtastwerte sind, um die Abtastwerte gemäß 1B zu erzeugen, die im Speicher gespeichert werden.
In Schritt S11 werden die Abtastwerte nacheinander abgerufen. In
Schritt S12 wird bestimmt, ob die Anzahl von Bytes die Kapazität eines
Pakets (2020 Bytes) erreicht hat. Wenn sie 2010 Bytes erreicht hat,
werden diese Abtastwerte bis zu dem (letzten) Abtastwert gepackt
(Schritt S13). Wenn die Anzahl von Bytes nicht die Kapazität eines
Pakets (1020 Bytes) erreicht hat, geht der Ablauf zu Schritt S14 über, bei
dem bestimmt wird, ob die Anzahl von Bytes der abgerufenen Abtastwerte
2010 Bytes überschreitet.
Wenn sie 2010 Bytes nicht überschreitet,
kehrt der Ablauf zu Schritt S11 zurück. Wenn sie 2010 Bytes überschreitet,
wird andererseits der letzte abgerufene Abtastwert zur Position
von Schritt S11 zurückverwiesen
und der Unterschied zwischen der Anzahl restlicher Bytes und 2010 Bytes
wird in Schritt S15 berechnet. Dann wird bestimmt, ob diese Differenz
R 8 Bytes überschreitet
(Schritt S16). Wenn die Differenz R 8 Bytes überschreitet, wird ein Padding (Auffüllen) ausgeführt (Schritt
S17), um ein Paket aufzubauen, während,
wenn die Differenz R gleich oder weniger als 7 Bytes beträgt, ein
Stuffing (Stopfen) ausgeführt
(Schritt S18), um ein Paket aufzubauen.
-
Die Reproduktions- bzw. Wiedergabevorrichtung,
welche die oben erläuterten
Daten reproduziert, wird im folgenden kurz beschrieben.
-
10 zeigt
einen optischen Plattenspieler, 11 zeigt
die Basisstruktur einer Plattenlaufwerksektion 501, welche
eine optische Plätte 10 antreibt, auf
der der oben beschriebene Audio-Stream 7 aufgezeichnet
wird, und 12 stellt
ein Diagramm zur Erläuterung
eines Beispiels der Struktur der optischen Platte 10 dar.
-
Im folgenden wird der optische Plattenspieler in
Fig.. 10 erläutert.
-
Der optische Plattenspieler hat einen
Tastenbetätigungs- Anzeigeabschnitt 500.
Der optische Plattenspieler ist mit einem Monitor 11 und
Lautsprechern 12 verbunden. Von der optischen Platte 10 abgegriffene
Daten werden über
die Plattenlaufwerksektion 501 an eine Systemverarbeitungssektion 504 gesendet.
Die von der optischen Platte 10 abgegriffenen Daten umfassen
beispielsweise Bilddaten, Überlagerungsbilddaten
und Audiodaten, die in der Systemverarbeitungssektion 504 getrennt
werden. Die getrennten Bilddaten werden über einen Video-Puffer 506 einem
Video-Decodierer 508 zugeleitet, die Überlagerungsbilddaten werden über einen Überlagerungsbild-Puffer 507 einem Überlagerungsbild-Decodidierer 509 zugeleitet,
und die Audiodaten werden über
einen Rudio-Puffer 507 einem Rudio-Decodierer 513 zugeleitet.
Das von dem Video-Decodierer 508. decodierte Bildsignal
und das von dem Überlagerungsbild-Decodierer 509 decodierte Überlagerungsbildsignal
werden durch eine Synthetisiersektion 510 kombiniert und
das resultierende Signal in ein analoges Bildsignal durch einen D/A-Wandler 511 umgewandelt.
Dieses analoge Bildsignal wird dann an einen Monitor 11 gesendet.
Das von dem Audio-Decodierer 513 decodierte
Audiosignal wird durch einen D/A-Wandler 514 in
ein analoges Audiosignal umgewandelt, das wiederum den Lautsprechern 12 zugeleitet
wird.
-
Das gesamte Abspielgerät wird durch
eine System-CPU 502 gesteuert. Das heißt, die System-CPU 502 kann
Steuersignale, Timing-Signale und dgl. mit der Plattenlaufwerksektion 501,
der Systemverarbeitungssektion 504 und der Tastenbetätigungs/Anzeigesektion 500 austauschen.
Mit der System-CPU 502 verbunden ist ein System-ROM/RAM 503,
in dem feste Programme gespeichert sind, die es der System-CPU 502 ermöglichen,
eine Datenverarbeitung auszuführen.
Managementdaten o.dgl., die von der optischen Platte 10 reproduziert
werden, können
ebenfalls in der System-ROM/RAM 503 gespeichert werden.
-
Ein Daten-RAM 505, das mit
der Systemverarbeitungssektion 504 verbunden ist, wird
als Puffer verwendet, wenn die vorgenannte Datentrennung, Fehlerkorrektur
o.dgl. ausgeführt
wird.
-
Die Plattenlaufwerksektion 501 in 11 wird im folgenden erläutert.
-
Ein Plattenmotorantrieb 531 treibt
einen Spindelmotor 532 an. Wenn sich der Spindelmotor 532 dreht,
dreht sich die optische Platte 10 und auf der optischen
Platte 10 aufgezeichnete Daten können von einer optischen Kopfsektion 533 abgegriffen werden.
Das von der optischen Kopfsektion 533 abgegriffene Signal
wird an einen Kopfverstärker 534 gesendet,
dessen Ausgabe in die Systemverarbeitungssektion 504 eingegeben
wird.
-
Ein Vorschubmotor 535 wird
durch einen Vorschubmotortreiber 536 angetrieben. Der Vorschubmotor 535 treibt
die optische Kopfsektion 533 in der Radialrichtung der
optischen Platte 10 an. Die optische Kopfsektion 533 ist
mit einem Fokussiermechanismus und einem Spurfolgemechanismus versehen,
dem Antriebssignale jeweils von einer Fokussierschaltung 537 und
einer Spurfolgeschaltung 538 zugeführt werden.
-
Steuersignale werden dem Plattenmotortreiber 531,
dem Vorschubmotortreiber 536, der Fokussierschaltung 537 und
der Spurfolgeschaltung 538 von einem Servo-Prozessor 539 eingegeben.
Demgemäß steuert
der Plattenmotor 532 die Drehung der optischen Platte 10 derart,
daß die
Frequenz des abgegriffenen Signals eine vorbestimmte Frequenz wird,
die Fokussierschaltung 537 steuert den Fokussiermechanismus
des optischen Systems derart, daß der optische Strahl von der
optischen Kopfsektion 533 den optimalen Brennpunkt auf
der optischen Platte 10 bildet, und die Spurfolgeschaltung 538 steuert
den Spurfolgemechanismus derart, daß der optische Strahl die Mitte
der gewünschten
Aufzeichnungsspur trifft.
-
Im folgenden wird die Struktur der
optischen Platte 10 gemäß 12 erläutert.
-
Die optische Platte 10 weist
Informationsaufzeichnungsflächen
bzw. -bereiche 22 um Klemmbereiche 21 auf beiden Seiten
auf. Der Informationsaufzeichnungsbereich 22 hat einen
Auslaufbereich 23, in dem keine Information aufgezeichnet
wird, am Außenumfang,
und einen Einlaufbereich 24, in dem Information an der
Grenze zu dem zugeordneten Klemmbereich 21 aufgezeichnet
wird. Zwischen dem Auslaufbereich 23 und dem Einlaufbereich 24 liegt ein
Datenaufzeichnungsbereich 25.
-
Im Datenaufzeichnungsbereich 25 sind
kontinuierlich Spuren in Spiralform ausgebildet. Die Spuren sind
in mehrere physische Sektoren aufgeteilt, denen Seriennummern zugeteilt
werden. Signalflecken auf Spuren sind als Pits (Einbuchtungen) ausgebildet.
Für Nur-Lese-Optikplatten
wird eine Sequenz von Pits auf einem transparenten Substrat durch
ein Stanzgerät
gebildet, und ein reflektierender Film wird auf der mit Pits versehenen
Oberfläche ausgebildet,
um eine Aufzeichnungsschicht zu bilden. Eine Doppelplatten-Optikplatte hat zwei über eine
Klebeschicht aneinandergeklebte Platten, die eine Verbundplatte
ergeben, und zwar so, daß diese Aufzeichnungsschichten
einander zugewandt sind.
-
Das logische Format der optischen
Platte 10 wird nun erläutert.
-
13 zeigt
das logische Format der Informationsabschnitte des Informationsaufzeichnungsbereichs 25.
Dieses logische Format ist in Übereinstimmung
mit spezifischen Standards, wie z. B. Mikro-UDF und ISO 9660, festgelegt.
In der folgenden Beschreibung bedeutet eine logische Adresse eine logische
Sektornummer (LSN = logical sector number), die durch das Mikro-UDF
und ISO 9660 festgelegt ist, und logische Sektoren sind gleich groß wie die
vorgenannten physischen Sektoren, wobei jeder logische Sektor aus
2048 Bytes besteht. Es wird davon ausgegangen, daß serielle
logische Sektornummern (LSN) den logischen Sektoren in der aufsteigenden
Reihenfolge der physischen Sektornummern zugeteilt werden.
-
Das logische Format ist eine hierarchische Struktur
und hat einen Volumen- und Dateistrukturbereich 70, einen.
Videomanager 71, mindestens einen Videotitelsatz 72 und
einen weiteren Aufzeichnungsbereich 73. Diese Bereiche
werden an den Grenzen der logischen Sektoren unterschieden. Wie oben
erwähnt
wurde, beträgt
die Größe eines
logischen Sektors 2048 Byte. Die Größe eines logischen Blocks beträgt ebenfalls
2048 Byte, so daß ein
logischer Sektor als ein logischer Block definiert ist.
-
Der Dateistrukturbereich 70 ist äquivalent
mit einem Managementbereich, der durch Mikro-UDF und ISO 9660 definiert
ist, und Daten im Videomanager 71 werden in der System-ROM/RAM-Sektion 52 über die
Beschreibung in diesem Bereich 70 gespeichert. Information
zum Verwalten der Videotitelsätze ist
im Videomanager 71 beschrieben, der aus mehreren Dateien,
beginnend mit einer Datei #0, besteht. In jedem Videotitelsatz 72 sind
komprimierte Videodaten, Überlagerungsbilddaten,
Audiodaten und Playback-Steuerinformation
zum Reproduzieren bzw. Wiedergeben dieser Daten aufgezeichnet. Jeder
Videotitelsatz 72 besteht aus mehreren Dateien 74,
die ebenfalls an den Grenzen der logischen Sektoren unterschieden
werden.
-
In dem zusätzlichen Aufzeichnungsbereich 73 ist
Information aufgezeichnet, die verwendet wird, wenn die Information
im Videotitelsatz verwendet wird, oder Information, die exklusiv
verwendet wird.
-
Der Videomanager 71 wird
nachstehend mit Bezug auf 14 beschrieben.
-
Der Videomanager 71 besteht
aus Videomanagerinformation (VMGI) 75, einem Videoobjektsatz für ein Videomanager-Informationsmenü (VMGM_VOBS) 76 und
ein Backup der Videomanagerinformation (VMGI_BUP) 77.
-
Im VMGM_VOBS 76 sind Videodaten,
Audiodaten und Überlagerungsbilddaten
für das
Menü, das
dem Volumen der optischen Platte zugeordnet ist, gespeichert. Das
VMGM VOBS 76 kann beschreibende Information bereitstellen,
die durch Stimmtöne und
ein Überlagerungsbild
in Zusammenhang mit jedem der Titel in Volumen gegeben ist, und
die Auswahlanzeige für
die Titel. Wenn englische Konversationen zum Erlernen von Englisch
auf der optischen Platte aufgezeichnet sind, werden z. B. der Titelname jeder
englischen Konversation und Beispiele einer Lektion wiedergegeben
und angezeigt, während
ein Themensong akustisch wiedergegeben wird und jedes Überlagerungsbild
zeigt, welches Niveau welcher Text hat o.dgl. Die Lektionsnummern
(Niveaus) werden als Auswahlpunkte, die von einem Zuhörer auszuwählen sind,
angezeigt. Die VMGM VOBS 76 wird für eine solche Verwendung benutzt.
-
15 stellt
beispielhaft einen Videoobjektsatz (VOBS) 82 dar.
-
Es gibt zwei Typen von Videoobjektsätzen für ein Menü und einen
Typ von Videoobjektsatz für Videotitel,
wobei die drei Typen ähnliche
Strukturen aufweisen.
-
Der VOBS 82 ist als ein
Satz von einem oder mehreren Videoobjekten (VOB's) 83 definiert,
die für den
gleichen Zweck verwendet werden. Normalerweise besteht der VOBS
für ein
Menü aus
Videoobjekten (VOB's) zum Anzeigen mehrerer Menübildschirme, während der
VOBS für
einen Videotitelsatz aus VOB's zum Anzeigen normaler Bewegtbilder o.dgl.
besteht.
-
Jedem VOB wird eine ID-Nummer (VOB IDN#j)
zugeteilt, die zur Identifizierung dieses VOB benutzt wird. Ein
VOB besteht aus einer Zelle oder mehreren Zellen 84. Desgleichen
wird jeder Zelle eine ID-Nummer (C_IDN#j) gegeben, die zur Identifizierung
dieser Zelle dient. Das Videoobjekt für ein Menü kann eine einzige Zelle umfassen.
-
Ferner besteht eine Zelle aus einer
oder mehreren Videoobjekteinheiten (VOBU's). Eine einzelne VOBU
ist als Sequenz von Packs mit einem Navigationspack (NV-Pack) an
der Spitze definiert. Eine VOBU ist als Satz aller Packs definiert,
die zwischen dem NV-Pack (einschließlich der vorher genannten
DSI) und dem nächsten
NV-Pack aufgezeichnet sind. Die Wiedergabezeit für die VOBU ist äquivalent
zu der Wiedergabezeit für
Videodaten, die aus einer einzelnen Bildgruppe (GOP = Group Of Pictures)
oder mehreren GOP's besteht, die in diese VOBU aufgenommen sind,
und wird als gleich oder größer als
etwa 0,4 sec und gleich oder weniger als 1 sec definiert. Die MPEG-Standards
definieren eine GOP als komprimierte Bilddaten, die der Wiedergabezeit
von etwa 0,5 sec entsprechen. Gemäß den MPEG-Standards können etwa
0,5 sec Audioinformation und Bildinformation angeordnet werden.
-
Eine VOBU hat das vorgenannte NV-Pack am
Anfang, gefolgt von Video-Packs (V-Packs), Überlagerungsbild-Packs (SP-Packs)
und Audio-Packs (A-Packs), die in einer bestimmten Reihenfolge angeordnet
sind. Mehrere V-Packs in einer VOBU weisen komprimierte Bilddaten
auf, deren Wiedergabezeit gleich oder weniger als 1 sec beträgt, und
zwar in der Form einer GOP oder mehrerer GOP's. Audiosignale, die
dieser Wiedergabezeit entsprechen, werden komprimiert und als A-Packs angeordnet.
Die in dieser Wiedergabezeit verwendeten Überlagerungsbilddaten werden
komprimiert und als SP-Packs angeordnet. Es ist anzumerken, daß Audiosignale
beispielsweise mit 8 Datenströmen
als Pack aufgezeichnet werden, und Überlagerungsbilddaten mit beispielsweise
32 Datenströmen
als Pack aufgezeichnet werden.
-
Ein Stream von Audiosignalen sind
durch eine Art von Codiersystem codierte Daten und bestehen aus
8 Kanälen
linearer PCM-quantisierter Daten n beispielsweise 20 Bits.
-
Wiederum gemäß 14 beschreibt die VMGI 75 Information
zum Suchen nach einem Videotitel und umfaßt mindestens drei Tabellen 78, 79 und 80.
-
Eine Videomanagerinformations-Managementtabelle
(VMGI_MAT) 78 beschreibt die Größe der VMG 71, die
Startadresse jeder Information im Videomanager, dem Videoobjektsatz
für ein
Videomanagermenü (VMGM_VOBS)
zugeordnete Attributinformation und dgl.
-
Eine Titel-Suchzeigertabelle (TT_SRPT) 79 beschreibt
Eingangsprogrammketten (EPGC) der in dem Volumen der optischen Platte
enthaltenen Videotitel, die gemäß der über die
Tastenbetätigungs-/Anzeigesektion
der Vorrichtung eingegebene Titelnummer auswählbar sind.
-
Im folgenden werden die Programmketten mit
Bezug auf 16 erläutert. Jede
Programmkette 87 ist ein Satz von Programmnummern zum Reproduzieren
der Story eines bestimmten Titels, und ein Kapitel der Story eines
Titels oder die Story selbst wird mit einer kontinuierlichen Reproduktion
bzw. Wiedergabe von Programmketten ausgeführt. Eine Programmnummer besteht
aus mehreren Zell-ID-Nummern, von denen jede eine Zelle in der VOBS
spezifizieren kann.
-
Eine Videotitelsatz-Attributtabelle
(VTS ART) 80 beschreibt Attributinformation, die von Videotitelsätzen (VTS')
im Volumen der optischen Platte festgelegt ist. Die Attributinformation
weist die Anzahl von VTS', die Nummer, das Videokompressionssystem,
den Audiocodiermodus und den Anzeigetyp von Überlagerungsbildern auf.
-
Nach dem Paketsystem gemäß dieser
Erfindung nach obiger Beschreibung sind Audiodaten am Beginn jedes
Pakets immer der Beginn von Abtastdaten, und Pakete können als
Einheiten behandelt werden, so daß die Zeitfolgeverarbeitung
für die
Verarbeitung von Audiodaten und eine Sequenz von Arbeitsabläufen dieser
Zeitfolgeverarbeitung erleichtert wird.
-
Im folgenden wird eine Beschreibung
des Audio- Decodierers
gegeben, der Daten reproduziert bzw. wiedergibt, die in der oben
beschriebenen Form angeordnet und aufgezeichnet sind.
-
17 zeigt
die Basisstruktur des Audiodecodierers 513.
-
Der dargestellte Decodierer kann
Daten in allen Moden für
die in 8 gezeigten Anzahlen
von Kanälen
und Anzahlen von Bits von Abtastwerten reproduzieren. Eingabedaten
sind so gestaltet, daß die Anzahl
von Quantisierungsbits jedes von 8 Kanälen 24 Bits beträgt.
-
Eine Abtastwertsequenz, wie sie mit
Bezug auf 1 erläutert wurde, wird kontinuierlich
einem Eingabeanschluß 710 eingegeben.
Diese Abtastwertsequenz wird in den Eingabeanschluß 711 eines Schalters
SWO eingegeben. Der Schalter SWO weist Verteilungsanschlüsse für die einzelnen
Abtastwerte der Kanäle
An bis Hn und an bis hn auf. Die Anschlüsse, die Abtastwerten der einzelnen
Kanäle
zugeordnet sind, werden mit den gleichen Bezugsziffern wie repräsentative
Abtastwerte versehen. Die repräsentativen
Abtastwerte sind Abtastwerte AO bis H0, A1 bis H1, a0 bis h0 und
a1 bis h1.
-
Es wird davon ausgegangen, daß die Anschlüsse AO bis
HO und A1 bis H1 16-Bit-Anschlüsse
und die Anschlüsse
a0 bis h0 und a1 bis h1 4-Bit-Anschlüsse sind. Der zusätzliche
Abtastwert kann aus insgesamt 8 Bits bestehen, so daß zwei Sätze von
4-Bit-Anschlüssen,
a0 bis h0 und a1 bis h1 erstellt werden. Der 16-Bit-Anschluß AO ist
mit den oberen Bits (16 Bits) eines Speichers MAO verbunden,
und die zugeordneten 4-Bit-Anschlüsse a0 und a0
sind mit den unteren Bits (8 Bits) des Speichers MAO über betreffende
Schalter j1 und j2 verbunden. Der 16-Bit-Anschluß BO ist über einen Schalter JB mit den
oberen Bits eines Speichers MBO verbunden, und die zugeordneten
4-Bit-Anschlüsse
b0 und b0 sind mit den unteren Bits des Speichers MBO über betreffende
Schalter j1 und j2 verbunden. Der 16-Bit-Rnschluß CO. ist über einen Schalter JC mit den
oberen Bits eines Speichers MCO verbunden, und die zugeordneten
4-Bit-Anschlüsse
c0 und c0 sind mit den unteren Bits des Speichers MCO über betreffende
Schalter j1 und j2 verbunden. Ebenso sind die anderen Anschlüsse D0 bis
HO, D1 bis H1, d0 bis h0 und d1 bis h1 mit den zugeordneten Speichern
MDO bis MH1 verbunden.
-
Infolgedessen werden die einzelnen
Kanäle auf
die Speicher MAO bis MH1 verteilt. Die Ausgangsanschlüsse der
Speicher MAO und MA1 sind mit den Anschlüssen TRO, TaO, TaO, TA1, Ta1
und Ta1 eines A-Kanal-Ausgangsschalters SWA verbunden. TAO und TA1
sind 16-Bit-Anschlüsse,
und TaO, TaO, Ta1 und Ta1 sind 4-Bit-Anschlüsse. Auf ähnliche Weise sind die Ausgangsanschlüsse der
Speicher MBO und MB1 mit den Anschlüssen TBO, TbO, TbO, TB1, Tb1
und Tb1 eines B-Kanal-Ausgangsschalters
SWB verbunden. TBO und TB1 sind 16-Bit-Anschlüsse, und TbO, TbO, Tb1 und
Tb1 sind 4-Bit-Anschlüsse.
Die Ausgangsanschlüsse
der anderen Speicher sind ebenso mit den zugeordneten Ausgangsschaltern
verbunden.
-
Im folgenden wird die Arbeitsweise
des Audio-Decodierers 513 erläutert.
-
Abtastwerte S0, S1, e0, e1, ...,
die für
Aufzeichnungs-/Übertragungszwecke
angeordnet sind, und in den Schalter SWO einzugeben sind, können als
AO, BO, ..., HO, A1, B1,..., H1, a0, b0, ... b0 a1, b1,..., h0 als
Beispiele der einzelnen Kanäle
ausgedrückt
werden. Jedes der Hauptwörter
jedes Kanals besteht aus 16 Bits, und jedes Zusatzwort besteht aus
8 Bits. Angenommen, die Schalter des Schaltkreises sind alle geschlossen.
Wenn der Drehschalter SWO der Reihe nach vom obersten Kontakt aus geschaltet
wird, werden zugeordnete Abtastwerte an die Speicher MAO bis MH1 übertragen.
Auf diese Weise werden Doppelpaare von Abtastwerten zyklisch. in
den Speichern MA0 bis MH1 durch die Betätigung des Drehschalters SW0
gespeichert. Anschließend
werden Abtastwerte des gewünschten Kanals
unter diesen in den Speichern MAO bis MH1 gespeicherten Abtastwerten über den
zugeordneten Drehschalter gelesen. Der Hauptabtastwert und der zusätzliche
Abtastwert in jedem Leseabtastwert werden decodiert und dann für die nachfolgende
Verarbeitung kombiniert.
-
Es wird nun auf das Lesen des Kanals
A eingegangen. Mit dem Drehschalter SWR an der obersten 16-Bit-Kontaktposition wird
der 16-Bit-Abtastwert AO gelesen. Dann werden Abtastwerte a0 mit
einer Gesamtzahl von 8 Bits an zwei 4-Bit-Kontaktpositionen gelesen. An der nächsten 16-Bit-Kontaktposition wird
der 16-Bit-Abtastwert A1 gelesen. Dann werden Abtastwerte mit einer
Gesamtzahl von 8 Bits an zwei 4-Bit-Kontaktpositionen
gelesen. Wenn sich der Drehschalter SWA einmal dreht, werden Doppelpaare
von Abtastwerten AO, a0 und A1, a1 des Kanals A ausgelesen. Auf
diese Weise werden Doppelpaare. von Abtastwerten des Kanals A in
einer zeitlich sequentiellen Form erhalten. Danach werden hinsichtlich
der anderen Kanäle
B, C usw. Abtastwerte ebenfalls gelesen. Da Doppelpaar e, von Abtastwerten
jedesmal verarbeitet werden, wenn die Drehschalter SWO, SWA, ...,
und SWH eine Umdrehung ausführen,
sollte die Drehperiode die Hälfte
der Abtastfrequenz (fs/2) betragen.
-
18 stellt
eine weitere Ausführungsform des
Audiodecodierers dar.
-
Die dargestellte Ausführungsform
verarbeitet Daten in dem Fall, in dem zwei Kanäle vorhanden sind und die Anzahl
von Quantisierungsbits jedes Abtastwerts 20 Bits beträgt. Diese
Schaltung unterscheidet sich von der in 17 gezeigten in den Zuständen der
Schalter JB-JH, j1 und j2. Daher werden die gleichen Bezugsziffern
denjenigen Komponenten zugeteilt, die mit den entsprechenden Komponenten der
Schaltung in 17 gleich
sind.
-
Die Abtastwerte S0, S1, e0, e1 usw.
werden ausgedrückt
als AO, BO, A1, B1, a0, b0, a1, b1 usw. als Abfolge von Abtastwerten
der einzelnen Kanäle. Jeder
Hauptabtastwert jedes Kanals besteht aus 16 Bits und jeder zusätzliche
Abtastwert besteht aus 8 Bits.
-
Wie dargestellt ist, wird nur der
Schalter JB geschlossen, und die Schalter JC bis JH sind offen. Hinsichtlich
der Schalter j2 und j2, die den zusätzlichen Abtastwerten a0, b0,
a1 und b1 zugeordnet sind, sind nach der Darstellung nur die Schalter
j1 geschlossen und die anderen Schalter geöffnet. Diejenigen Schalter
j1 und j2, die den anderen zusätzlichen
Abtastwerten c0,..., h0, c1,..., h1 zugeordnet sind, sind alle offen.
-
Wenn der Drehschalter SWO Eingabedaten synchron
mit der Dateneingabe verteilt, sind zu übertragende Daten AO, BO, A1,
B1, a0 (4 Bits) , b0 (4 Bits) , a1 (4 Bits) und b1 (4 Bits) . Die
Betätigung
des Drehschalters SWO ermöglicht
es, daß die
Abtastwerte nur in die Speicher MAO, MBO, MA1 und MB1 in der dargestellten
Reihenfolge eingegeben werden.
-
Auf der Ausgabeseite werden Ausgaben
von denjenigen der Speicher MAO bis MH1 erhalten, die den Kanälen A und
B zugeordnet sind. Von den den anderen Kanälen zugeordneten Speichern
werden Daten 0 ausgegeben. Von den Schaltern j1 und j2 auf der Leseseite
sind die Schalter j1 geschlossen und die Schalter j2 geöffnet. Demgemäß wird ein 4-Bit-Zusatzabtastwert
einem 16-Bit-Hauptabtastwert folgend ausgelesen. Hinsichtlich des
Kanals A werden beim Schalten des Schalters SWA Daten des Kanals
A sequentiell in der Reihenfolge AO, a0 (4 Bits) A1 und a1 (4 Bits)
ausgegeben. Die Einstellungen der einzelnen Schalter und die Schaltvorgänge in der
oben beschriebenen Ausführungsform
sind programmierbar gemäß der Anzahl
von Kanälen
von Audiostreams und der Anzahl von Quantisierungsbits jedes Abtastwerts
eingestellt. Ein solcher Signalverarbeitungsmodus ist in der Videotitelsatz-Attributtabelle
gemäß 14 und dem in 7 gezeigten Paket-Header
beschrieben. Mit anderen Worten werden Audiodaten, die in einem
lineare PCM-Daten darstellenden Audiopaket enthalten sind, die Audioframenummer,
die Anzahl von Quantisierungsbits, die Abtastfrequenz, die Audio-Kanalnummer
etc. beschrieben.
-
Die in den 17 und 18 dargestellten
Decodierer können
alle Moden bewältigen
und sind sogenannte Volldecodierer, die auf eine Maschine höherer Klasse
einstellbar sind, welche alle Kanäle reproduzieren kann.
-
Das Konzept dieser Erfindung bezieht
sich auf ein Datenanordnungsverfahren, ein Aufzeichnungs-/Reproduktionsverfahren
und eine Bearbeitungsvorrichtung, die verschiedene Arten von Moden bewältigen kann,
welche durch vielerlei Kombinationen der Anzahl von Kanälen und
der Anzahl von Quantisierungsbits entstehen. Die Datenanordnung kann
der vorgenannten hochklassigen Maschine ebenso wie einer minderklassigen
Maschine angepaßt
werden, welche dem Erfordernis niedriger Kosten entspricht, z. B.
einer Maschine, die nur 16-Bit-Daten von zwei Kanälen in jedem
Modus reproduziert. Eine solche Maschine weist vorteilhafterweise
einen kleineren Schaltkreisumfang auf als die hochklassige Maschine.
-
Die Schalter, die dazu verwendet
werden, einzelne Abtastwerte zu verteilen und Rbtastwerte von zugeordneten
Speichern abzurufen, sind zwar als mechanische Schalter dargestellt,
sie bestehen jedoch alle aus elektronischen Schaltungen.
-
Es wird nun ein Audio-Decodierer
in einem minderklassigen Abspielgerät beschrieben. Dieser Audio-Decodierer verarbeitet
16-Bit-Daten nur der Kanäle
A und B. Eingabe-Abtastwerte sind aus 8 Kanälen und die Anzahl von Quanitisierungsbits
beträgt 24
Bits.
-
Eine Sequenz von Abtastwerten, wie
sie mit Bezug auf die 1 erläutert wurde,
wird kontinuierlich an einen Eingabeanschluß 810 in 19 eingegeben. Diese Abtastwertsequenz
wird dem Eingabeanschluß 811 eines
Schalters SWO eingegeben. Der Schalter SWO weist Verteilungsanschlüsse für die individuellen
Abtastwerte der Kanäle
An bis Hn und an bis hn auf. Die Anschlüsse, die den Abtastwerten der einzelnen
Kanäle
zugeordnet sind, tragen die gleichen Bezugsziffern wie repräsentative
Abtastwerte, wie die Abtastwerte AO bis HO, A1 bis H1, a0 bis h0 und
a1 bis h1.
-
Es wird davon ausgegangen, daß die Anschlüsse AO bis
HO und A1 bis H1 16-Bit-Anschlüsse
sind, und die Anschlüsse
a0 bis h0 und a1 bis h1 4-Bit-Anschlüsse. Da der zusätzliche
Abtastwert aus einer Gesamtzahl von 8 Bits bestehen kann, werden zwei
Sätze von
4-Bit-Anschlüsse,
AO bis HO und a1 bis h1 erstellt.
-
In diesem Decodierer sind jedoch
nur die Anschlüsse
AO und A1 sowie BO und B1 jeweils mit den Speichern MA und MB verbunden,
wobei die anderen Anschlüsse
CO bis HO und c0 bis h0 geerdet sind. Der Schalter SWO kann auf
diese Weise gestaltet sein; oder er kann so gestaltet sein, daß er von
Beginn an nur zwei dieser Systeme den Kanälen A und B zugeordnet hat.
-
Die Schalter SWA und SWB dienen zum
Lesen von Daten aus den Speichern MA und MB in Einheiten von 16
Bits. Die Schalter SWA und SWB arbeiten derart, daß Ausgabedaten
miteinander übereinstimmen.
-
Die Arbeitsweise dieses Audio-Decodierers wird
nun erläutert.
-
Abtastwerte S0, S1, e0, e1,..., die
für den Aufzeichnungs-/Übertragungszweck
angeordnet sind und am Schalter SWO einzugeben sind, können als
AO, BO,..., HO, A1, B1,..., H1, a0, b0,..., h0, a1, b1,..., h0 als
Abtastwerte der einzelnen Kanäle
ausgedrückt
werden. Jeder Hauptabtastwert jedes Kanals besteht aus 16 Bits und
jedes zusätzliche
Wort besteht aus 8 Bits. Die Schalter der Schaltkreise sind alle
geschlossen. Wenn der Drehschalter SWO sequentiell vom obersten
Kontakt aus geschaltet wird, werden die zugeordneten Abtastwerte
an die Speicher MAO und MB1 übertragen.
Die anderen Abtastwerte werden alle entfernt.
-
Anschließend werden die in den Speichern MAO
und MB1 gespeicherten Abtastwerte hinsichtlich der Kanäle A und
B gelesen.
-
Da zwei Abtastwerte bei einer einmaligen Drehung
des Drehschalters SWO verarbeitet werden, sollte die Drehperiode
die Hälfte
der Abtastfrequenz fs betragen. Da ein Abtastwert gelesen wird, wenn
sich jeder der Drehschalter SWA und SWB einmal dreht, ist die Frequenz
fs.
-
Ein weiterer Audio-Decodierer in
einem minderklassigen Abspielgerät
wird nun erläutert.
Dieser Audio-Decodierer verarbeitet 16-Bit-Daten nur der Kanäle A und
B. Eingabe-Abtastwerte
sind aus zwei Kanälen
und die Anzahl von Quantisierungsbits beträgt 20 Bits.
-
Eine Abfolge von Abtastwerten, wie
sie mit Bezug auf 1 erläutert wurde,
wird kontinuierlich in dem Eingabeanschluß 810 in 20 eingegeben. Diese Abtastwertsequenz
wird an den Eingabeanschluß 811 des
Schalters SWO angelegt. Der Schalter SWO weist Verteilungsanschlüsse für die einzelnen
Abtastwerte der Kanäle
An bis Hn und an bis hn auf. Die Anschlüsse, die Abtastwerten der einzelnen Kanäle zugeordnet
sind, tragen die gleichen Bezugsziffern wie repräsentative Abtastwerte, d. h.
wie die Abtastwerte AO, BO, A1, B1, a0, b0, a1 und b1.
-
Die Anschlüsse AO, BO, A1 und B1 sind 16-Bit-Terminals
und die Anschlüsse
a0, b0, a1 und b1 sind 4-Bit-Terminals. Um die Moden von zwei Kanälen und
die Quantisierungsbits von 20 Bits zu bewältigen; ist nur der Schalter
JB geschlossen und die Schalter JC bis JH sind geöffnet. Diejenigen
Schalter j1 und j2, die den Anschlüssen a0, b0, a1 und b1 zugeordnet
sind, sind geschlossen, und die den anderen Anschlüssen zugeordneten
Schalter j3 bis j16 sind geöffnet.
-
Wenn der Drehschalter SWO in der
obigen Situation sequentiell geschaltet wird, findet keine Datenübertragung
statt. Es werden nur die Hauptabtastwerte AO, BO, A1 und B1 an die
Speicher MA und MB übertragen.
Was die zusätzlichen
Abtastwerte a0, b0, a1 und b1 betrifft, so werden diese zusätzlichen
Abtastwerte entfernt, da ihre zugeordneten Schalter geerdet sind.
Die Funktion des Lesens von Abtastwerten aus den Speichern MA und
MB wird auf die gleiche Art und Weise ausgeführt, wie bei der vorher beschriebenen
Ausführungsform.
-
Die vorhergehende Beschreibung der
minderklassigen Maschine erfolgte zwar mit Bezug auf zwei Moden,
es können
jedoch auch Daten von zwei Kanälen
in jedem Modus gemäß der selektiven
geöffneten
oder geschlossenen Zustände
der Schalter abgerufen werden. Der spezielle Punkt, der anzumerken
ist, ist der, daß die
Verarbeitung für
zusätzliche Abtastwerte
8 Bits um 8 Bits ausgeführt
wird. Die oben beschriebene Datenanordnung läßt die Anzahl von Bits eines
Paars von zusätzlichen
Abtastwerten ein ganzzahliges Vielfaches von 8 Bits werden, ungeachtet
der Anzahl von Kanälen,
selbst wenn jedes zusätzliche
Wort jedes Kanals aus 4 Bits besteht. Selbst wenn zusätzliche
Abtastwerte in einem Low-Class-Decodierer entfernt werden müssen, ist daher
eine 8-Bit-Verarbeitung möglich.
-
Da die Hauptworte von zusätzlichen
Abtastwerten jeweils aus 16 Bits bestehen, können sie alle 8 Bits um 8 Bits
verarbeitet werden, was bei der Gestaltung einer spezifischen Schaltung
sehr vorteilhaft ist.
-
Jedes Audio-Pack hat einen Pack-Header. Wie 21 zeigt, besteht der Pack-Header
aus einem Pack-Startcode (4 Bytes), einer System-Taktreferenz (SCR)
(6 Bytes), einer Programm-Multiplexrate (3 Bytes) und einer
Pack-Stopflänge
(1 Byte). Der SCR stellt die Zeit dar, die zum Abruf dieses Audio-Packs
erforderlich ist. Falls der Wert, den SCR darstellt, kürzer: ist
als ein Bezugswert in der Plattenabspielvorrichtung, wird das Audio-Pack
in dem Audio-Puffer
gespeichert. Die Steuerschaltung bezieht sich auf eine Pack-Stopflänge und
bestimmt eine Leseadresse auf der Basis der Pack-Stopflänge.
-
22 zeigt
den Inhalt des Paket-Headers eines Audio-Pakets. Der Paket-Header umfaßt ein Packet
Start Code-Prefix, das den Start eines Pakets angibt, eine Stream-ID,
die angibt, welche Daten das Paket hat, und Daten, welche die Länge des
Paket-Streams angeben. Im Paket-Header sind auch verschiedene Arten
von Informationen eines Paket-Elementar-Streams (PES = packet elementary stream)
beschrieben, wie z. B. ein Flag, das das Verbot oder die Erlaubnis
des Kopierens angibt, ein Flag, das angibt, ob die Information eine
originale oder eine kopierte ist, sowie die Länge des Paket-Headers. Ein
Darstellungs-Zeitprotokoll (PTS = presentation time stamp) für die Synchronisierung
des Ausgabe-Timings dieses Pakets mit derjenigen von anderen Videodaten
oder Überlagerungsbilddaten
ist außerdem
in dem Paketheader beschrieben. Weitere Information, wie z. B. ein
Flag, das angibt, ob es eine Beschreibung eines Puffers gibt, und
das die Puffergröße angibt,
ist im ersten Paket im ersten Feld in jedem Videoobjekt beschrieben.
-
Der Paket-Header weist auch Stopf-Bytes von
0 bis 7 Bytes auf. Der Paket-Header hat ferner eine Sub-Stream-ID,
die einen Audio-Stream, lineare PCM oder einen anderen Kompressionstyp
sowie die Anzahl von Audio-Streams angibt. Ferner sind im Paket-Header
die Anzahl von Frames von Audiodaten, deren erstes Byte in diesem
Paket gelegen ist, beschrieben. Darüber hinaus ist ein Zeiger (pointer)
für eine
Einheit, auf die als erste zuzugreifen ist, durch die Anzahl von
logischen Blöcken
vom letzten Byte dieser Information beschrieben. Somit gibt der
Zeiger den ersten Audioframe an, der als erster zu der von der PTS
beschriebenen Zeit decodiert werden soll. Der Zeiger gibt die erste
Byte-Adresse dieses Audioframes an. Ferner sind in dem Paket-Header
ein Audio-Betonungsflag, das angibt, ob beim Hochfrequenzband betont
werden soll oder nicht, ein Stumm-Flag zum Bereitstellen eines Stumm-Status, wenn
Audioframe-Daten alle 0 sind, und eine Framenummer, welche den Frame
in einer Audioframe-Gruppe (GOF) angibt, auf den als erster zuzugreifen
ist, beschrieben. Steuerinformation, wie z. B. die Länge eines
quantisierten Worts oder die Anzahl von Quantisierungs-Bits, die
Abtastfrequenz, die Anzahl von Kanälen und der dynamische Bereich
sind ebenfalls beschrieben.
-
Die obige Header-Information wird
durch eine Decodierer-Steuersektion
(nicht dargestellt) im Audio-Decodierer analysiert. Die Decodierer-Steuersektion
schaltet die Signalverarbeitungsschaltung im Decodierer auf den
Signalverarbeitungsmodus, der aktuell abgerufenen Audiodaten zugeordnet
ist. Die Schaltungsmoden werden mit Bezug auf die 17 bis 20 erläutert. Information
wie diese Header-Information
ist auch im Videomanager beschrieben, so daß, wenn eine solche Information
im Anfangsstadium des Reproduktions- bzw. Wiedergabevorgangs gelesen
wird, die Information danach für
die Wiedergabe des gleichen Sub-Streams
nicht nochmals gelesen werden muß. Der Grund, warum Modusinformation,
die zur Reproduktion von Audiodaten notwendig ist, im Header jedes
Pakets nach obiger Beschreibung beschrieben ist, besteht darin,
daß ein empfangender
Anschluß den
Modus der Audiodaten immer dann identifizieren kann, wenn ein Empfang im
Fall der Übertragung
einer Sequenz von Paketen über
einen Kommunikationspfad startet.
-
23 ist
ein Blockdiagramm des in die Plattenabspielvorrichtung eingegliederten
Audiodaten-Verarbeitungssystems,
das die Systemverarbeitungssektion 504, und den Audio-Decodierer 513 detaillierter
darstellt als in 10.
-
In der Systemverarbeitungssektion 504 wird ein
Eingabe-Hochfrequenzsignal
(Lesesignal) einem Sync-Detektor 601 zugeführt. Der
Detektor 601 erfaßt
und Zusatzhiert ein Sync-Signal
aus dem Lesesignal und erzeugt ein Timing-Signal. Das Lesesignal,
das nun kein Sync-Signal enthält;
wird in einen 8-16-Demodulator 602 eingegeben, welcher das 16-Bit-Signal
in eine Abfolge von 8-Bit-Daten demoduliert. Die 8-Bit-Daten werden
einer Fehlerkorrekturschaltung 603 eingegeben. Die Datenausgabe
aus der Schaltung 603, die fehlerfrei ist, wird in einen
Demultiplexer 604 eingegeben. Der Demultiplexer 604 verarbeitet
die Daten, wobei er das Video-Pack, das Überlagerungsbild-Pack und das
Audio-Pack gemäß der Referenz
der Stream-ID erkennt. Diese Packs werden vom Demultiplexer 604 dem
Video-Decodierer 508, dem Überlagerungsbild-Decodierer 509 und dem
Audio-Decodierer 513 zugeführt.
-
Dabei wird das Audio-Pack in einen
Audiopuffer 611, gegeben und der Pack-Header sowie Paket-Header
des Audio-Packs
werden in eine Steuerschaltung 612 gegeben. Die Steuerschaltung 612 erkennt
den Inhalt des Audio-Packs, d. h. den Start-Code, die Stopflänge, den
Paket-Startcode und die Stream-ID des Audiopacks. Ferner erkennt
die Steuerschaltung 612 die Substream-ID, den ersten Zugriffspunkt,
die Anzahl quantisierter Audiobits, die Anzahl von Kanälen und
die Abtastfrequenz. Die Stopfbyte-Länge und die Füllpaketlänge werden
aus diesen so erkannten Datengrößen auf
der Basis der in 4 dargestellten Tabelle
bestimmt.
-
Die Steuerschaltung 612 erkennt
das Paket der linearen PCM auf der Basis der Substream-ID.
-
Infolgedessen kann die Steuerschaltung 612 die
Zusatzktionsadresse der Audiodaten, die im Audiopuffer 611 gespeichert
ist, identifizieren. Wenn er durch die Schaltung 612 gesteuert
wird, gibt der Audiopuffer 611 Abtastwerte wie z. B. die
Abtastwerte S0, S1, e0, e1, S2, S3, ..., aus. Die Steuerschaltung 612 kann
die Anzahl von Stopfbytes und/oder die Anzahl von Füllpaketen
erkennen, sobald sie mindestens die Anzahl quantisierter Bits, die
Abtastrate und die Anzahl von Audiokanälen erkannt hat. Die Schaltung 612 kann
Daten auf der Basis dieser so erkannten Datengrößen Zusatzhieren.
-
Die vom Audiopuffer 611 ausgegebenen
Rbtastwerte werden einem Kanalprozessor 613 zugeführt. Der
Prozessor 613 weist eine Struktur des in 17 bis 20 gezeigten Typs auf. Sein Betriebsmodus
wird durch die Steuerschaltung 612 gesteuert.
-
Das Audiopaket, das Videopaket, das Überlagerungsbildpaket
und die Aufzeichnungsspuren der optischen Platte, die alle oben
beschrieben wurden, haben eine spezifische physische Beziehung, die
nachstehend erläutert
wird.
-
Wenn ein Teil der Aufzeichnungsfläche einer optischen
Platte 10 gemäß 24A vergrößert wird, erkennt
man Pit-Abfolgen,
wie sie in 24B veranschaulicht
sind. Ein Satz von Pit-Abfolgen bildet einen Sektor, wie aus 24C und 24D zu erkennen ist, die zwei weitere
vergrößerte Ansichten
der optischen Platte 10 sind. Die Sektoren werden sequentiell
durch den optischen Kopf gelesen. Anschließend werden die Audiopakete
in Echtzeit reproduziert.
-
Im folgenden werden die Sektoren
mit Bezug auf die 25A und 25B beschrieben. Wie 25B zeigt, besteht ein Sektor,
in dem Audiodaten aufgezeichnet sind, aus 13 x 2 Frames. Jedem Sektor
ist ein Sync-Code zugewiesen. Obwohl die Frames in 25B so dargestellt sind, als ob sie sequentiell
in Reihen und Spalten angeordnet wären, sind sie sequentiell in
einer einzigen Reihe auf einer Spur angeordnet. Genauer gesagt,
sind die Frames mit den Sync-Codes
SYO, SY5, SY1, SY2, SY5,... in der genannten Reihenfolge angeordnet.
-
Der einem Rahmen zugewiesene Sync-Code
besteht aus 32 Bits (16 Bits x 2), und die in einem Rahmen
aufgezeichneten Daten bestehen aus 1456 Bits (16 Bits x
91). Dies bedeutet, daß der
Sektor durch einen 16-Bit-modulierten Code ausgedrückt ist,
da 16-Bit-Datengrößen, die
durch Modulieren von 8 Bit-Datengrößen erhalten wurden, auf der
optischen Platte aufgezeichnet sind. Jeder Sektor umfaßt auch
einen aufgezeichneten modulierten Fehlerkorrekturcode.
-
26A zeigt
einen Sektor, in dem 8-Bit-Datengrößen, die durch Demodulieren
der in dem oben beschriebenen physischen Sektor aufgezeichneten 16-Bit-Datengrößen erhalten
wurde. Die Datenmenge in diesem Sektor beträgt: (172 + 19) Bytes x (12
+ 1) Linien. Jede Linie enthält
einen 10-Byte-Fehlerkorrekturcode.
Ein Korrekturcode ist für
jede Linie vorgesehen. Wenn zwölf
Korrekturcodes jeweils für
zwölf Linien
gesammelt sind, fungieren sie als Fehlerkorrekturcode für zwölf Spalten.
-
Die in einem aufzuzeichnenden/aufgezeichneten
Sektor aufgezeichneten Daten werden zu einem Datenblock des in 26B gezeigten Typs, wenn
das Fehlerkorrektursignal daraus entfernt wird. Der Datenblock besteht
aus 2048-Byte-Hauptdaten, einer
6-Byte-Sektor-ID, einem 2-Byte-ID-Fehlererfassungscode, 6-Byte-Copyright-Managementdaten und
einem 4-Byte-Fehlererfassungscode. Wie 26B zeigt, werden die Sektor-ID, der
ID-Fehlererfassungscode und die Copyright-Managementdaten dem Kopf der Hauptdaten
hinzugefügt,
während der
Fehlererfassungscode dem Ende der Hauptdaten hinzugefügt wird.
Die 2048-Byte-Hauptdaten sind ein oben definiertes Pack. Ein Pack-Header,
ein Paket-Header und Audiodaten sind in dem Pack in der vom Kopf
des Packs aus genannten Reihenfolge beschrieben. Im Pack-Header
und dem Paket-Header sind verschiedene Posten von Führungsinformation beschrieben,
die zur Verarbeitung der Audiodaten verwendet werden.
-
Wie oben angegeben wurde, ist ein
Paket, das aus auf spezifische Weise angeordneten Audio-Abtastwerten
besteht, in jedem aufzuzeichnenden/aufgezeichneten Sektor auf der
Platte aufgezeichnet. Der Audio-Decodierer kann lineare PCM-Daten
in einer gewünschten
Weise reproduzieren, obwohl die PCM-Daten in einem aufzuzeichnenden/aufgezeichneten
Sektor aufgezeichnet sind. Dies liegt daran, daß der Startteil der in jedem
Pack enthaltenen Audiodaten der Startteil des Hauptabtastwerts ist,
und auch daran, daß der
Pack-Header und der Paket-Header Steuerdaten enthalten, die ausreichen,
damit der Audio-Decodierer Audiodaten verarbeitet.
-
Ein ECC-Block (ECC = error-correction
Code) wird im folgenden mit Bezug auf die 27A und 27B beschrieben.
Wie 27A zeigt, besteht
der ECC-Block aus 16 aufzuzeichnenden/aufgezeichneten Sektoren.
Wie 26A zeigt, kann
jeder Sektor 12 Datenzeilen aufzeichnen, wobei jede Zeile
eine 127-Byte-Datengröße ist.
Jeder Spalte wird eine äußere Parität von 16
Byte hinzugefügt,
und jeder Zeile wird eine innere Parität (PI) von 10 Bytes hinzugefügt. Wie 27B zeigt, ist die äußere Parität (PO) von
16 Byte auf 1 Bit für
jede Zeile verteilt. Infolgedessen enthält ein aufzuzeichnender/aufgezeichneter
Sektor 13 Zeilen (12 + 1) von Daten. In 27A gibt "BO, 0, BO, 1,
..." Adressen. von Bytes an. In 27B bezeichnet
"0, 1, 2, ... 15" jeweils die 16 aufzuzeichnenden/aufgezeichneten
Sektoren.
-
Die Video-Packs, Überlagerungsbild-Packs und
Audio-Packs sind auf der Spur der Platte verschachtelt. Diese Erfindung
ist jedoch nicht auf diese Anordnung der Packs beschränkt. Diese
Erfindung kann auf die Platte angewandt werden, auf der nur die
Audio-Packs angeordnet sind, oder auf die Platte, auf der Audio-Packs
und Überlagerungsbild-Packs angeordnet
sind, oder auf die Platte, in der Audio-Packs, Überlagerungsbild-Packs und NV-Packs angeordnet
sind. Die Packs können
frei miteinander kombiniert werden.