DE69721877T2

DE69721877T2 - Datenanordnungsverfahren und Medium zur Datenaufzeichnung oder -transfer, und Signalverarbeitungsgerät für das Verfahren und das Medium

Info

Publication number: DE69721877T2
Application number: DE69721877T
Authority: DE
Inventors: Hirohisa 1-1 Shibaura 1-chome Nishiwaki; Hideki 1-1 Shibaura 1-chome Mimura; Shigeru 1-1 Shibaura 1-chome Todokoro
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1996-03-21
Filing date: 1997-03-20
Publication date: 2004-02-19
Anticipated expiration: 2017-03-21
Also published as: ATE240579T1; CN1171598A; EP0797198A3; CN1120490C; EP0797198B1; KR100256662B1; DE69721877D1; EP0797198A2; ES2198513T3; US5892848A; CA2200538C; TW319870B; CA2200538A1

Description

Die vorliegende Erfindung bezieht sich auf ein Datenanordnungsverfahren und ein Medium zum Aufzeichnen oder Übertragen von Daten o.dgl., die auf einer digitalen Videoplatte und einer digitalen Audioplatte aufzuzeichnen sind, sowie auf eine Signalverarbeitungsvorrichtung zum Verarbeiten der Daten.
In jüngster Zeit sind digitale Videoplatten als optische Platten zusätzlich zu den herkömmlichen Compact Disks (nachstehend als "CDs" bezeichnet) für den Audio-Gebrauch entwickelt worden, und Abspielgeräte für solche digitale Videoplatten sind ebenfalls entwickelt worden. Die digitalen Videoplatten umfassen im einzelnen eine Art, die in etwa dieselbe Größe (12 cm Durchmesser) wie die herkömmlichen CDs aufweist und so ausgelegt ist, daß etwa zwei Stunden Bildinformation auf dieser Platte aufgezeichnet und von ihr wiedergegeben werden können. Für eine solche digitale Videoplatte gibt es ein Format, das gestattet, Sprechton oder Musik in acht verschiedenen Sprachen und überlagerte Information in zweiunddreißig verschiedenen Sprachen auf der gleichen Platte zusätzlich zu der Bildinformation aufzuzeichnen.
Es sind auch digitale Videoplatten, die Sprechton oder Musik in mehreren Sprachen zusätzlich zu der Hauptbild-Information aufzeichnen können und die gleiche Größe aufweisen wie die herkömmlichen CDs, entwickelt worden. Falls solche digitale Videoplatten auf dem Markt verfügbar werden, wäre es selbstverständlich ein natürliches Bedürfnis, Musikstücke oder Stimmpassagen (Audiosignale) von neuen digitalen Videoplatten ebenso wie von den herkömmlichen CDs zu reproduzieren bzw. wiederzugeben. Die Aufzeichnungssysteme für Audiosignale umfassen ein Kompressionssystem und ein lineares PCM-System. Wenn man eine Videoplatte in Betracht zieht, von der Audiosignale von Musikstücken und Stimmpassagen durch einen ausschließlichen Audio-Player wiedergegeben werden können, ist es effektiv, Daten durch die lineare PCM-Technik, wie sie für die herkömmlichen CDs verwendet wird, aufzuzeichnen. Höchstwahrscheinlich werden sowohl minderklassige als auch hochklassige Arten von Videoplattenspielern auf dem Markt verfügbar.
Die Dokumente D1 = EP-A-O 795 859 und D2 = EP-A-O 797 199, die unter Art. 54(3) EPÜ fallen, offenbaren ein Verfahren zum Aufzeichnen von digitalen Mehrkanal-Audiodaten, wobei Abtastdaten jedes Kanalssignals in ein aus MSBs bestehendes Hauptwort und ein aus LSBs bestehendes Zusatzwort aufgeteilt werden. Eine Sammlung von Hauptwörtern einzelner Kanäle wird als Haupt-Abtastwert und eine Sammlung von Zusatzwörtern als Zusatz-Abtastwert angeordnet. Die Haupt- und Zusatz-Abtastwerte zweier aufeinanderfolgender Zeitpunkte werden als Paare angeordnet.
Demgemäß ist es eine Aufgabe der vorliegenden Erfindung, ein Datenanordnungsverfahren und einen Träger für die Datenaufzeichnung oder Datenübertragung bereitzustellen, die bei der Aufzeichnung oder Bearbeitung von Daten o.dgl. eines linearen PCM-Systems wirksam sind, und die Mehrkanalsignale von höherer Qualität als die von herkömmlichen CDs aufzeichnen können und sowohl unterklassigen als auch hochklassigen Maschinen ermöglichen, einen Reproduktions- bzw. Wiedergabevorgang einfach auszuführen, und eine Signalverarbeitungsvorrichtung zum Verarbeiten solcher Daten.
Um die obige Aufgabe zu erfüllen, wird ein Verfahren zum Aufzeichnen oder Übertragen quantisierter Daten bereitgestellt, die durch Abtasten eines Kanalsignals oder Mehrkanalsignals in einer zeitlich sequentiellen Art und Weise gemäß Anspruch 1 erhalten werden.
Mit der obigen Struktur wird eine Reproduktionsschaltung einfach in einer niederklassigen Maschine aufgebaut, die nur Hauptwörter oder nur zwei Kanäle von Hauptwörtern reproduziert, während eine Reproduktionsschaltung für Zusatzwörter bei einer hochklassigen Maschine nur der Hauptwort-Reproduktionsschaltung hinzuzufügen ist.
Diese Erfindung ist aus der folgenden detaillierten Beschreibung in Zusammenhang mit den beigefügten Zeichnungen besser verständlich, in denen zeigen:
1A bis 1D erläuternde Diagramme zur Darstellung einer Abtaststruktur und der Anordnung von Abtastwerten für die Erklärung einer grundlegenden Ausführungsform dieser Erfindung,
2 eine erläuternde Darstellung zur Veranschaulichung einer Beziehung zwischen den Abtastwerten in
1D, einem Frame und einer Gruppe,
3A und 3B erläuternde Darstellungen einer Beziehung zwischen einem Audioframe und einer Sequenz von Packs gemäß dieser Erfindung,
4A und 4B Darstellungen allgemeiner Audiodatenanordnungen in einem 20-Bit-Mode und einem 24-Bit-Mode,
5 eine erläuternde Darstellung des Prinzips der Verschachtelung,
6A und 6BB erläuternde Darstellungen eines Beispiels der Anordnung von Packs und der Struktur eines Audiopacks in dieser Anordnung gemäß dieser Erfindung,
7 eine erläuternde Ansicht zur Darstellung der detaillierten Struktur eines Audio-Packs,
8 eine erläuternde Ansicht zur beispielhaften Darstellung einer Liste von Größen linearer PCM-Daten in einem Paket, an das diese Erfindung angepaßt ist,
9 eine erläuternde Ansicht zur Darstellung von Generierungsprozeduren eines Audio-Packs,
10 ein strukturelles Blockdiagramm eines Platten-Abspielgeräts,
11 eine erläuternde Ansicht einer Plattenlaufwerksektion, 12 eine erläuternde Ansicht einer optischen Platte,
13 eine erläuternde Ansicht zur Darstellung des logischen Formats einer optischen Platte,
14 eine erläuternde Ansicht eines Videomanagers in 9,
15 eine erläuternde Ansicht eines Videoobjektsatzes in 8,
16 eine erläuternde Ansicht einer Programmkette,
17 ein Diagramm zur Darstellung eines Beispiels der Basis-Schaltungsstruktur eines Audio-Decoders gemäß dieser Erfindung,
18 eine Ansicht zur Darstellung eines weiteren Beispiels der Basis-Schaltungsstruktur des Audio-Decoders,
19 eine Ansicht zur Darstellung eines weiteren Beispiels der Basis-Schaltungsstruktur des Audio-Decoders,
20 eine Ansicht zur Darstellung eines noch anderen Beispiels der Basis-Schaltungsstruktur des Audio-Decoders,
21 eine Tabelle zur Darstellung des Inhalts des Pack-Headers des Audio-Packs,
22 eine Tabelle zur Darstellung des Inhalts des Paket-Headers des Audio-Packs,
23 ein Blockdiagramm, das hauptsächlich das Audiodaten-Verarbeitungssystem zeigt, das in das Plattenwiedergabegerät eingegliedert ist,
24A bis 24D Ansichten zur Darstellung einer Platte, einer Pit-Abfolge, einer Sektor-Abfolge bzw. eines physischen Sektors,
25A und 25B jeweils ein Diagramm zur Darstellung eines physischen Sektors und einer Tabelle, welche den Inhalt des physischen Sektors darstellt,
26A und 26B Ansichten zur Darstellung der Struktur eines aufzuzeichnenden/aufgezeichneten Sektors, und
27A und 27B Ansichten zur Darstellung eines Fehlerkorrektur-Codeblocks.
Im folgenden werden bevorzugte Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die beigefügten Zeichnungen beschrieben.
Zunächst wird eine Datenanordnung durch das lineare PCM-System in dem Datenaufzeichnungssystem gemäß dieser Erfindung erläutert. Man beachte, daß 16 Bits, 20 Bits oder 24 Bits beispielsweise willkürlich als Quantisierungsbits bei linearen PCM-Daten verwendet werden. Ferner umfassen Audio-Moden monaurale Moden, Stereo-Moden, 3-Kanal-, 4-Kanal-, 5-Kanal-, 6-Kanal-, 7-Kanal- und 8-Kanal-Moden.
Es wird davon ausgegangen, daß es acht Kanäle (A bis H) von Audiosignalen gibt. Diese Audiosignale werden mit einer Abtastfrequenz von 48 KHz oder 96 KHz abgetastet, um quantisiert zu werden. Im folgenden wird ein Beispiel beschrieben, bei dem die Quantisierungsbits 20 Bits sind.
1A zeigt, wie acht Kanäle von Audiosignalen A bis H abgetastet werden. Es wird angenommen, daß jeder Abtastwert auf beispielsweise 20 Bits quantisiert. wird. Es ist auch dargestellt, daß jeder Abtastwert von 20 Bits in ein Hauptwort und ein Zusatzwort unterteilt ist.
Die Hauptwörter der einzelnen Kanäle sind durch Großbuchstaben des Alphabets plus ein Suffix "n" angegeben, und die Extra- bzw. Zusatzwörter sind durch Kleinbuchstaben des Alphabets plus das Suffix "n" angegeben, wobei n (= 0, 1, 2, 3, ...) die Abtastreihenfolge angibt. Jedes Hauptwort besteht aus 16 Bits und jedes Zusatzwort besteht aus 4 Bits.
Einzelne Abtastwerte werden in Form von A0a0, A1a1, A2a2, A3a3, A4a4 usw. für das Signal A, B0b0, B1b1, B2b2, B3b3, B4b4 usw. für das Signal B, C0c0, C1c1, C2c2, C3c3, C4c4 usw. für das Signal C, ..., und H0h0, H1h1, H2h2, H3h3, H4h4 usw. für das Signal H erzeugt.
1B stellt das obige Wortanordnungsformat als eine Sequenz von Abtastwerten für den Fall dar, bei dem diese Wörter auf einem Aufzeichnungsmedium aufgezeichnet sind.
Zunächst werden alle Abtastdaten, die aus 20 (=M) Bits bestehen, in ein Hauptwort von 16 (=m1) Bits auf der MSB-Seite und ein Zusatzwort von 4 (=m2) Bits auf der LSB-Seite unterteilt. Als nächstes werden die Null-ten (= 2n-ten) Hauptwörter in den einzelnen Kanälen kollektiv angeordnet. Dann werden die ersten (= (2n + 1)-ten) Hauptwörter in den einzelnen Kanälen kollektiv angeordnet. Dann werden die null-ten (=2n-ten) Zusatzwörter in den einzelnen Kanälen kollektiv angeordnet. Dann werden die ersten (= (2n + 1)-ten) Zusatzwörter in den einzelnen Kanälen kollektiv angeordnet. Man beachte, daß n = 0, 1, 2, ...
Eine Gruppe von Hauptwörtern in den einzelnen Kanälen ist ein Hauptabtastwert. Ebenso ist eine Gruppe von Zusatzwörtern in den einzelnen Kanälen ein Zusatz-Abtastwert.
Bei Anwendung eines solchen Formats sollte ein Datenreproduktionsverfahren durch eine kostengünstige Maschine (z. B. eine, die im 16-Bit-Modus arbeitet) nur Hauptwörter behandeln, während ein Datenreproduktionsprozeß durch eine kostspielige Maschine (z. B. eine, die in einem 20-Bit-Modus arbeitet) sowohl Hauptwörter als auch ihre zugeordneten Zusatzwörter behandeln sollte.
1C zeigt, wie einzelne Abtastwerte unter Verwendung der spezifischen Bitnummern für den Hauptabtastwert und den Zusatz-Abtastwert angeordnet werden.
In der Form von solchen quantisierten linearen PCM-Codes kann die Trennung eines 20-Bit-Abtastwerts in ein 16-Bit-Hauptwort und ein 4-Bit-Zusatzwort folgendes ermöglichen. Die Maschine, welche im 16-Bit-Mode arbeitet, kann einfach unnötige Abschnitte durch Ausführen einer Datenverarbeitung in Einheiten von 8 Bits in den Bereichen von Zusatz-Abtastwerten in der Abtastwertanordnung aussondern bzw. beseitigen. Dies rührt daher, daß zwei Zusatz-Abtastwerte 4 Bits mal 8 Kanäle und 4 Bits mal 8 Kanäle sind, und diese Daten 8 mal hintereinander in den Einheiten von 8 Bits verarbeitet (ausgesondert bzw. beseitigt) werden können.
Das Merkmal dieser Datenanordnung ist nicht auf dasjenige dieser Ausführungsform beschränkt. In jedem Fall, in dem es eine ungerade Anzahl von Kanälen gibt, oder indem ein Zusatzwort aus 8 Bits besteht, ist die Gesamtzahl von Bits zweier aufeinanderfolgender Zusatz-Abtastwerte ein ganzzahliges Vielfaches von 8 Bits, so daß eine kostengünstige Maschine, welche nur Hauptwörter reproduziert, Zusatz-Abtastwerte überspringen kann, indem ein Ausscheidungsprozeß n aufeinanderfolgende Male 8 Bits um 8 Bits gemäß dem Modus ausführt.
Daten in dem Zustand in 1B können dann einem Modulationsprozeß unterzogen werden, um auf einem Aufzeichnungsmedium aufgezeichnet zu werden. Falls Daten zusammen mit anderer Steuerinformation und Videoinformation aufzuzeichnen sind, ist es vorzuziehen, daß die Daten in der Form aufgezeichnet werden, die auf der Zeitbasis einfach gemanagt wird, um eine Datenhandhabung und Synchronisierung zu erleichtern. In dieser Hinsicht erfolgt die folgende Frame-Formierung, Gruppierung und Paket-Formierung.
1D zeigt eine Sequenz von Audioframes. Die Einheit von Daten über eine gegebene Reproduktionszeit beträgt 1/600 sec., was einem Frame entspricht. Einem Frame sind 80 oder 160 Abtastwerte zugeteilt. Mit einer Abtastfrequenz von 48 KHz ist ein Abtastwert 1/4800 sec. Und (1/48000) mal 80 Abtastwerte = 1/600 sec. Mit einer Abtastfrequenz von 96 KHz ist ein Abtastwert 1/9600 sec. Und (1/96000) x 160 Abtastwerte = 1/600 sec. Offensichtlich besteht ein Frame aus 80 Abtastwerten oder 160 Abtastwerten.
2 zeigt eine Beziehung zwischen dem vorgenannten einen Frame und einer GOF (Framegruppe). Ein Frame besteht aus 80 oder 160 Abtastwerten und stellt Daten von 1/600 sec dar, und eine GOF-besteht aus 20 Frames. Somit ist eine GOF (1/600) sec x 20 = 1/30 sec, was die Frequenz eines TV-Frames bzw. -Teilbilds ist. Eine Sequenz von solchen GOF's ist ein Audiostream. Diese Einheit, GOF, wird bei der Synchronisierung mit einem Videosignal wirksam. Da dieser Frame zusammen mit anderen Steuersignalen und Videosignalen aufgezeichnet wird, ist er in Pakete verteilt. Die Beziehung zwischen diesem Paket und einem Frame wird nachstehend beschrieben.
3A zeigt die Beziehung zwischen dem Paket und dem Frame.
DSI ist eine Datensuchinformation, V ist ein Videoobjekt, A ist ein Audioobjekt und S ist ein Überlagerungsbildobjekt (sub picture object). Jeder Block wird als Pack bezeichnett. Ein Pack ist als 2048 Bytes definiert. Ein Pack umfaßt ein Paket und besteht aus einem Pack-Header, einem Paket-Header und einem Paket. In der DSI ist Information zum Steuern aller Daten zur Playback-Zeit beschrieben, wie z. B. die Startadresse und Endadresse jedes Packs.
3B zeigt nur extrahierte Audiopacks. Obwohl DSI-Packs, Videopacks V und Audiopacks A tatsächlich in der Anordnung gemäß 3A gemischt sind, sind nur Audiopacks A in 2B dargestellt, um zum besseren Verständnis der Beziehung zwischen einem Frame und Packs beizutragen. Gemäß den Standards dieses Systems ist Information so angeordnet, daß es etwa 0,5 sec. dauert, um Information zwischen einer DSI und der nächsten DSI zu reproduzieren bzw. wiederzugeben.
Da nach obiger Erläuterung ein Frame 1/600 sec. ist, bestehen zwischen einer DSI und einer anderen DSI 30 Audioframes. Die Datenmenge (D) eines Frames variiert je nach der Abtastfrequenz (fs), der Anzahl von Kanälen (N) und der Anzahl von Quantisierungsbits (m).
Wenn fs = 48 KHz, so ist D = 80 × N × m, und wenn fs = 96 KHz ist, so ist D = 160 × N × m.
Daher muss ein Frame nicht notwendigerweise einem Pack entsprechen; mehrere Frames oder weniger als ein Frame können einem Pack entsprechen. D. h., der Kopf eines Frames kann in die Mitte eines Packs kommen, wie in 3B gezeigt ist. Positionsinformation des Kopfs eines Frames ist im Pack-Header beschrieben und ist als Anzahl von Datenzählungen (Timings) von dem Pack-Header oder DSI beschrieben. Beim Reproduzieren bzw. Wiedergeben von Daten von dem vorgenannten Aufzeichnungsmedium ruft die Wiedergabevorrichtung einen Frame von Audiopacks ab, Zusatzhiert Daten eines zu reproduzierenden Kanals und liefert die Daten dem Audio-Decoder, um einen Deeodiervorgang auszuführen.
4A stellt die Beziehung zwischen einem Hauptwort (16 Bits) und einem Zusatzwort (4 Bit) im 20-Bit-Mode dar, wobei sie allgemein die vorgenannte Datenanordnung zeigt, und
4B veranschaulicht die Beziehung zwischen einem Hauptwort (16 Bits) und einem Zusatzwort (8 Bits) im 24-Bit-Mode.
Gemäß den 4A und 4B weisen Abtastdaten die vorgenannte Frame-Struktur und Pack-Struktur mit einem ganzzahligen Vielfachen von Doppelpaaren von Abtastwerten auf, wobei jedes Paar aus einem Haupt-Abtastwert und einem Zusatz-Abtastwert besteht.
Die vorstehende Beschreibung ist davon ausgehend gegeben worden, daß kein Verschachtelungsverfahren im Signalformat ausgeführt wird. Wenn ein Kratzer auf einem Aufzeichnungsmedium vorhanden ist oder aufeinanderfolgende Datenausfälle während der Datenübertragung vorkommen, kann eine Verschachtelung, falls sie ausgeführt wurde, die aufeinanderfolgenden Signalverluste reduzieren. Es ist bekannt, daß diese Verschachtelung eine annähernde Interpolation von verlorengegangenen Abtastdaten ermöglichen kann.
5 stellt das Prinzip des Verschachtelns (interleaving) und "Entschachtelns" (deinterleaving) für das oben beschriebene Format dar. Gemäß der Datenanordnung dieser Erfindung kann selbst bei Ausführung einer Verschachtelung eine billige Maschine nur Hauptwörter einfach verschachteln. Dies bringt den Vorteil mit sich, daß die Schaltung vereinfacht werden kann.
Dieses Beispiel verwendet eine Verzögerungs-Verschachtelungstechnik mit einer Verschachtelungslänge D von 2k Abtastwerten. In der Figur bedeutet S einen Hauptabtastwert, und die Hauptabtastwerte S0 = A0, B0,... H0, S1 = A1, B1,... H1, S2 = A2, B2,... H2, und Sj = Aj, Bj, Cj, ... Hj. Der Buchstabe "e" bedeutet einen Zusatz-Abtastwert, und Zusatz-Abtastwerte e0 = a0, b0,... h0, e1 = a1, b1, ... h1, e2 = a2, b2,... h2, und ej = aj, bj, cj,... hj. Geradzahlige Haupt-Abtastwerte werden einem verzögerungslosen Übertragungssystem L11 eingegeben, und ungeradzahlige Hauptabtastwerte werden in ein Verzögerungs-Übertragungssystem L12 eingegeben. Geradzahlige Zusatzabtastwerte werden in ein verzögerungsloses Übertragungssystem L13 eingegeben, und ungeradzahlige Zusatz-Abtastwerte werden in ein Verzögerungs-Übertragungssystem L14 eingegeben.
Der Verzögerungsbetrag von Zusatzabtastwerten, von denen jeder aus 4 Bits besteht, kann ein Viertel des Verzögerungsbetrags von Hauptabtastwerten (16 Bits) betragen, und der Verzögerungsbetrag von Zusatzabtastwerten, von denen jeder aus 8 Bits besteht, kann eine Hälfte des Verzögerungsbetrags von Hauptabtastwerten (16 Bits betragen. Daher ist das Verzögerungs-Übertragungssystem L14 so gestaltet, daß es den Verzögerungsbetrag zwischen dem 20-Bit-Mode und dem 24-Bit-Mode schalten kann.
Spalten der einzelnen Abtastwerte auf der Eingabeseite des Übertragungssystems in 5 behalten das Format bei, das in Bezug auf Fig. 1B erläutert wurde. Mit den Spalten synchronisierter Abtastwerte werden die einzelnen Abtastwerte in die zugeordneten Übertragungssysteme eingegeben. Im Ergebnis wird eine zweidimensionale Anordnung von Abtastwerten, wie sie auf der rechten Seite der einzelnen Übertragungssysteme zu erkennen ist, abgerufen. Obwohl die Dateninhalte von Spalten in der zweidimensionalen Anordnung sich von denjenigen vor der Verschachtelung unterscheiden, enthält diese Anordnung nach wie vor Kombinationen von zwei Hauptabtastwerten und zwei Zusatzabtastwerten in der Vertikalrichtung.
Beim Ausführen des Entschachtelungsprozesses werden selbst Spalten von Hauptabtastwerten in einen Verzögerungsübertragungspfad eingegeben, während ungeradzahlige Spalten von Hauptabtastwerten einem verzögerungslosen Übertragungspfad eingegeben werden. Auf ähnliche Weise werden geradzahlige Spalten von Zusatzabtastwerten einem Verzögerungs-Übertragungspfad eingegeben, während ungeradzahlige Spalten von Zusatzabtastwerten einem verzögerungslosen Übertragungspfad eingegeben werden. Diese Bearbeitung kann die ursprüngliche Abtastwertanordnung liefern. Im 16-Bit-Mode sind nur die Übertragungssysteme für Hauptabtastwerte zu verwenden.
Auf der Reproduktionsseite sollte eine Maschine, welche nur Hauptabtastwerte reproduziert, eine Entschachtelungs-Schaltung (deinterleave circuit) aufweisen, die nur Hauptabtastwerte behandelt. Um nur einen spezifischen Kanal zu reproduzieren, wird eine Entschachtelungsschaltung verwendet, welche Wörter in Abtastdaten dieses spezifischen Kanals behandelt.
Wie oben beschrieben wurde, kann diese Erfindung ein Datenanordnungsverfahren und einen Träger zum Aufzeichnen oder Übertragen von Mehrkanaldaten des linearen PCM-Systems bereitstellen, was es ermöglicht, daß sowohl niederklassige als auch hochklassige Maschinen einen Reproduktionsprozeß ausführen können, sowie eine Verarbeitungsvorrichtung, welche solche Daten verarbeitet.
6A stellt beispielhaft die Anordnung von Packs dar, von denen jedes ein Paket aufweist.
DSI ist eine Datensuchinformation, V ist ein Videoobjekt, A ist ein Audioobjekt und S ist ein Überlagerungsbildobjekt. Jeder Block wird Pack genannt. Die Größe eines Packs ist auf 2048 Bytes festgelegt. Ein Pack umfaßt ein Paket und besteht aus einem Pack-Header, einem Paket-Header und einer Paket-Datensektion. Im DSI ist Information zum Steuern aller Daten zur Playback-Zeit, wie z. B. die Startadresse und Endadresse jedes Packs beschrieben.
6B zeigt nur extrahierte Audiopacks A. Obwohl DSI-Packs, Video-Packs und Audio-Packs tatsächlich in der Anordnung gemäß 6A gemischt sind, sind in 6B nur Audio-Packs dargestellt, um zum Verständnis von, Packs beizutragen. Die Standards dieses Systems definieren, daß der Betrag bzw. die Menge an Information, die zwischen DSIs angeordnet ist, etwa 0,5 sec äquivalent sein sollte, wenn Information zwischen DSIs reproduziert bzw. wiedergegeben wird. Wie oben erwähnt wurde, besteht ein Pack aus einem Pack-Header, einem Paket-Header und einer Paket-Datensektion.
Im Pack-Header und dem Paket-Header ist Information beschrieben, die zum Reproduzieren bzw. Wiedergeben von Audiodaten notwendig ist, wie z. B. die Größe eines Audiopacks, ein Präsentations-Zeitprotokoll zum Synchronisieren mit der Reproduktionsausgabe von Videodaten, ein Identifizierungscode (ID) eines Kanals (stream) Quantisierungsbits, eine Abtastfrequenz und eine Startadresse und Endadresse von Daten.
Audiodaten, die in dieses Paket eingefügt sind, weisen Doppelpaare von Abtastwerten auf, wobei, jedes Paar aus zwei Hauptabtastwerten und zwei Zusatzabtastwerten gemäß 1A bis 1C besteht.
7 zeigt ein Audio-Pack-in Vergrößerung. Im Datenbereich dieses Audio-Packs sind doppelte Paare von Abtastwerten angeordnet, wobei das obere Doppelpaar von Abtastwerten (A0-H0, A1-H1) am Kopf bzw. Anfang des Datenbereichs gelegen ist. Die Anzahl von Bytes in einem Pack ist auf 2048 Bytes festgelegt. Da Abtastwerte Daten mit variabler Länge sind, sind 2048 Bytes nicht notwendigerweise gleich einem ganzzahligen Vielfachen der Bytelänge von zwei Paaren von Abtastwerten. Daher kann sich ein Fall ergeben, bei dem die maximale Bytelänge eines Packs sich von der Bytelänge von (Doppelpaar von Abtastwerten x ganze Zahl) unterscheidet. In diesem Fall ist die Bytelänge eines Packs so eingestellt, daß die Bytelänge des Packs ? (Doppelpaar von Abtastwerten x ganze Zahl) wird. Falls ein Teil eines Packs übrig bleibt, wird ein Stopfbyte in den Pack-Header eingefügt, wenn der Rest gleich oder weniger ist als 7 Bytes, während ein Auffüllpaket (padding packet) am Ende des Packs eingefügt wird, wenn der Rest 7 Bytes überschreitet.
Audioinformation bei diesem Packformat kann zur Zeit der Reproduktion bzw. Wiedergabe einfach gehandhabt werden.
Da die vorderen Audiodaten in jedem Pack das vordere Doppelpaar von Abtastwerten oder Hauptabtastwerten ist, wird der Reproduktionsprozeß einfacher, wenn die Reproduktion bzw.
Wiedergabe mit dem geeigneten Timing ausgeführt wird. Dies kommt daher, daß die Wiedergabevorrichtung Pack um Pack Daten abruft und eine Datenverarbeitung ausführt. Falls Abtastwerte von Audiodaten über zwei Packs hinweg gelegen sind, sind die zwei Packs abzurufen und die Audiodaten nach der Integrierung zu decodieren. Dies kompliziert die Verarbeitung, wenn die vorderen bzw. anfänglichen Audiodaten in jedem Pack immer das vordere Doppelpaar von Abtastwerten ist und Audiodaten Pack um Pack wie bei dieser Erfindung gruppiert sind, sollte ein Timing nur für ein Pack vorgenommen werden, womit die Datenverarbeitung erleichtert wird. Ferner vereinfacht die Paket-um-Paket-Datenverarbeitung das Autorensystem (Hilfssystem), welches die Software zur Verarbeitung von Daten vereinfachen kann.
Bei einer speziellen Wiedergabe o.dgl. können Videodaten einem Ausdünnen oder einer Interpolation unterzogen werden. In einem solchen Fall ist es möglich, da Audiodaten Paket um Paket behandelt werden können, das Reproduktions-Timing relativ einfach zu steuern. Ferner muss Software für die Decoder nicht kompliziert sein. Zwar werden Abtastwerte in dem oben beschriebenen System so generiert, daß jeder Abtastwert in die, oberen 16 Bits und die unteren 4 Bits unterteilt ist, Daten müssen jedoch nicht notwendigerweise ein solches Format annehmen, solange lineare PCM-Audiodaten abgetastet werden.
Mit der Datenlänge eines Zusatz-Abtastwerts gleich 0 wird beispielsweise eine Abfolge von Daten, eine Sequenz von Hauptabtastwerten, was das allgemeine Datenformat ist. In diesem Fall sind keine Zusatz-Abtastwerte vorhanden, so daß kein Bedarf besteht, Doppelpaare von Abtastwerten zu erzeugen, und es sind nur Hauptabtastwerte in Pakete umzuformen.
8 zeigt eine Liste der Größen linearer PCM-Daten, wenn lineare PCM-Daten in einem Paket in den Einheiten von Doppelpaaren von Abtastwerten nach obiger Erläuterung angeordnet sind bzw. werden. Die Datengrößen sind als die Anzahl von Maximal-Abtastwerten dargestellt, die in ein Pack separat für die monauralen (mono), Stereo und Multikanal-Moden einzusetzen sind. Jede Gruppe zeigt die Datengrößen für die betreffenden Anzahlen von Quantisierungsbits. Da Doppelpaare von Abtastwerten als Einheiten genommen werden, ist jede Anzahl von Abtastwerten in einem Paket eine gerade Zahl. Bei steigender Anzahl von Kanälen erhöht sich die Anzahl von Bytes dementsprechend, so daß die Anzahl von Abtastwerten in einem Paket abnimmt. Wenn die Anzahl von Quantisierungsbits 16 Bits beträgt und der Mode der monaurale Mode ist, beträgt die Anzahl von Abtastwerten in einem Paket 1004, und die Anzahl von Bytes 2008 mit dem Stopfbyte von 5 Bytes, was angibt, daß es keine Füllbytes gibt. Es ist jedoch anzumerken, daß das erste Paket Stopfbytes von 2 Bytes aufweist. Dies liegt daran, daß 3-Byte-Attributinformation an den Header des ersten Pakets angefügt werden kann.
Bei einer Anzahl von Quantisierungsbits von 24 Bits und im Stereo-Mode wird das vordere Paket mit 6 Stopfbytes versehen und die nachfolgenden Pakete mit 9 Füllbytes versehen.
9 veranschaulicht die Arbeitsgänge der Vorrichtung, welche Packs erzeugt.
Man nehme an, daß Audiosignale jedes Kanals Abtastwerte sind, um die Abtastwerte gemäß 1B zu erzeugen, die im Speicher gespeichert werden. In Schritt S11 werden die Abtastwerte nacheinander abgerufen. In Schritt S12 wird bestimmt, ob die Anzahl von Bytes die Kapazität eines Pakets (2020 Bytes) erreicht hat. Wenn sie 2010 Bytes erreicht hat, werden diese Abtastwerte bis zu dem (letzten) Abtastwert gepackt (Schritt S13). Wenn die Anzahl von Bytes nicht die Kapazität eines Pakets (1020 Bytes) erreicht hat, geht der Ablauf zu Schritt S14 über, bei dem bestimmt wird, ob die Anzahl von Bytes der abgerufenen Abtastwerte 2010 Bytes überschreitet. Wenn sie 2010 Bytes nicht überschreitet, kehrt der Ablauf zu Schritt S11 zurück. Wenn sie 2010 Bytes überschreitet, wird andererseits der letzte abgerufene Abtastwert zur Position von Schritt S11 zurückverwiesen und der Unterschied zwischen der Anzahl restlicher Bytes und 2010 Bytes wird in Schritt S15 berechnet. Dann wird bestimmt, ob diese Differenz R 8 Bytes überschreitet (Schritt S16). Wenn die Differenz R 8 Bytes überschreitet, wird ein Padding (Auffüllen) ausgeführt (Schritt S17), um ein Paket aufzubauen, während, wenn die Differenz R gleich oder weniger als 7 Bytes beträgt, ein Stuffing (Stopfen) ausgeführt (Schritt S18), um ein Paket aufzubauen.
Die Reproduktions- bzw. Wiedergabevorrichtung, welche die oben erläuterten Daten reproduziert, wird im folgenden kurz beschrieben.
10 zeigt einen optischen Plattenspieler, 11 zeigt die Basisstruktur einer Plattenlaufwerksektion 501, welche eine optische Plätte 10 antreibt, auf der der oben beschriebene Audio-Stream 7 aufgezeichnet wird, und 12 stellt ein Diagramm zur Erläuterung eines Beispiels der Struktur der optischen Platte 10 dar.
Im folgenden wird der optische Plattenspieler in Fig.. 10 erläutert.
Der optische Plattenspieler hat einen Tastenbetätigungs- Anzeigeabschnitt 500. Der optische Plattenspieler ist mit einem Monitor 11 und Lautsprechern 12 verbunden. Von der optischen Platte 10 abgegriffene Daten werden über die Plattenlaufwerksektion 501 an eine Systemverarbeitungssektion 504 gesendet. Die von der optischen Platte 10 abgegriffenen Daten umfassen beispielsweise Bilddaten, Überlagerungsbilddaten und Audiodaten, die in der Systemverarbeitungssektion 504 getrennt werden. Die getrennten Bilddaten werden über einen Video-Puffer 506 einem Video-Decodierer 508 zugeleitet, die Überlagerungsbilddaten werden über einen Überlagerungsbild-Puffer 507 einem Überlagerungsbild-Decodidierer 509 zugeleitet, und die Audiodaten werden über einen Rudio-Puffer 507 einem Rudio-Decodierer 513 zugeleitet. Das von dem Video-Decodierer 508. decodierte Bildsignal und das von dem Überlagerungsbild-Decodierer 509 decodierte Überlagerungsbildsignal werden durch eine Synthetisiersektion 510 kombiniert und das resultierende Signal in ein analoges Bildsignal durch einen D/A-Wandler 511 umgewandelt. Dieses analoge Bildsignal wird dann an einen Monitor 11 gesendet. Das von dem Audio-Decodierer 513 decodierte Audiosignal wird durch einen D/A-Wandler 514 in ein analoges Audiosignal umgewandelt, das wiederum den Lautsprechern 12 zugeleitet wird.
Das gesamte Abspielgerät wird durch eine System-CPU 502 gesteuert. Das heißt, die System-CPU 502 kann Steuersignale, Timing-Signale und dgl. mit der Plattenlaufwerksektion 501, der Systemverarbeitungssektion 504 und der Tastenbetätigungs/Anzeigesektion 500 austauschen. Mit der System-CPU 502 verbunden ist ein System-ROM/RAM 503, in dem feste Programme gespeichert sind, die es der System-CPU 502 ermöglichen, eine Datenverarbeitung auszuführen. Managementdaten o.dgl., die von der optischen Platte 10 reproduziert werden, können ebenfalls in der System-ROM/RAM 503 gespeichert werden.
Ein Daten-RAM 505, das mit der Systemverarbeitungssektion 504 verbunden ist, wird als Puffer verwendet, wenn die vorgenannte Datentrennung, Fehlerkorrektur o.dgl. ausgeführt wird.
Die Plattenlaufwerksektion 501 in 11 wird im folgenden erläutert.
Ein Plattenmotorantrieb 531 treibt einen Spindelmotor 532 an. Wenn sich der Spindelmotor 532 dreht, dreht sich die optische Platte 10 und auf der optischen Platte 10 aufgezeichnete Daten können von einer optischen Kopfsektion 533 abgegriffen werden. Das von der optischen Kopfsektion 533 abgegriffene Signal wird an einen Kopfverstärker 534 gesendet, dessen Ausgabe in die Systemverarbeitungssektion 504 eingegeben wird.
Ein Vorschubmotor 535 wird durch einen Vorschubmotortreiber 536 angetrieben. Der Vorschubmotor 535 treibt die optische Kopfsektion 533 in der Radialrichtung der optischen Platte 10 an. Die optische Kopfsektion 533 ist mit einem Fokussiermechanismus und einem Spurfolgemechanismus versehen, dem Antriebssignale jeweils von einer Fokussierschaltung 537 und einer Spurfolgeschaltung 538 zugeführt werden.
Steuersignale werden dem Plattenmotortreiber 531, dem Vorschubmotortreiber 536, der Fokussierschaltung 537 und der Spurfolgeschaltung 538 von einem Servo-Prozessor 539 eingegeben. Demgemäß steuert der Plattenmotor 532 die Drehung der optischen Platte 10 derart, daß die Frequenz des abgegriffenen Signals eine vorbestimmte Frequenz wird, die Fokussierschaltung 537 steuert den Fokussiermechanismus des optischen Systems derart, daß der optische Strahl von der optischen Kopfsektion 533 den optimalen Brennpunkt auf der optischen Platte 10 bildet, und die Spurfolgeschaltung 538 steuert den Spurfolgemechanismus derart, daß der optische Strahl die Mitte der gewünschten Aufzeichnungsspur trifft.
Im folgenden wird die Struktur der optischen Platte 10 gemäß 12 erläutert.
Die optische Platte 10 weist Informationsaufzeichnungsflächen bzw. -bereiche 22 um Klemmbereiche 21 auf beiden Seiten auf. Der Informationsaufzeichnungsbereich 22 hat einen Auslaufbereich 23, in dem keine Information aufgezeichnet wird, am Außenumfang, und einen Einlaufbereich 24, in dem Information an der Grenze zu dem zugeordneten Klemmbereich 21 aufgezeichnet wird. Zwischen dem Auslaufbereich 23 und dem Einlaufbereich 24 liegt ein Datenaufzeichnungsbereich 25.
Im Datenaufzeichnungsbereich 25 sind kontinuierlich Spuren in Spiralform ausgebildet. Die Spuren sind in mehrere physische Sektoren aufgeteilt, denen Seriennummern zugeteilt werden. Signalflecken auf Spuren sind als Pits (Einbuchtungen) ausgebildet. Für Nur-Lese-Optikplatten wird eine Sequenz von Pits auf einem transparenten Substrat durch ein Stanzgerät gebildet, und ein reflektierender Film wird auf der mit Pits versehenen Oberfläche ausgebildet, um eine Aufzeichnungsschicht zu bilden. Eine Doppelplatten-Optikplatte hat zwei über eine Klebeschicht aneinandergeklebte Platten, die eine Verbundplatte ergeben, und zwar so, daß diese Aufzeichnungsschichten einander zugewandt sind.
Das logische Format der optischen Platte 10 wird nun erläutert.
13 zeigt das logische Format der Informationsabschnitte des Informationsaufzeichnungsbereichs 25. Dieses logische Format ist in Übereinstimmung mit spezifischen Standards, wie z. B. Mikro-UDF und ISO 9660, festgelegt. In der folgenden Beschreibung bedeutet eine logische Adresse eine logische Sektornummer (LSN = logical sector number), die durch das Mikro-UDF und ISO 9660 festgelegt ist, und logische Sektoren sind gleich groß wie die vorgenannten physischen Sektoren, wobei jeder logische Sektor aus 2048 Bytes besteht. Es wird davon ausgegangen, daß serielle logische Sektornummern (LSN) den logischen Sektoren in der aufsteigenden Reihenfolge der physischen Sektornummern zugeteilt werden.
Das logische Format ist eine hierarchische Struktur und hat einen Volumen- und Dateistrukturbereich 70, einen. Videomanager 71, mindestens einen Videotitelsatz 72 und einen weiteren Aufzeichnungsbereich 73. Diese Bereiche werden an den Grenzen der logischen Sektoren unterschieden. Wie oben erwähnt wurde, beträgt die Größe eines logischen Sektors 2048 Byte. Die Größe eines logischen Blocks beträgt ebenfalls 2048 Byte, so daß ein logischer Sektor als ein logischer Block definiert ist.
Der Dateistrukturbereich 70 ist äquivalent mit einem Managementbereich, der durch Mikro-UDF und ISO 9660 definiert ist, und Daten im Videomanager 71 werden in der System-ROM/RAM-Sektion 52 über die Beschreibung in diesem Bereich 70 gespeichert. Information zum Verwalten der Videotitelsätze ist im Videomanager 71 beschrieben, der aus mehreren Dateien, beginnend mit einer Datei #0, besteht. In jedem Videotitelsatz 72 sind komprimierte Videodaten, Überlagerungsbilddaten, Audiodaten und Playback-Steuerinformation zum Reproduzieren bzw. Wiedergeben dieser Daten aufgezeichnet. Jeder Videotitelsatz 72 besteht aus mehreren Dateien 74, die ebenfalls an den Grenzen der logischen Sektoren unterschieden werden.
In dem zusätzlichen Aufzeichnungsbereich 73 ist Information aufgezeichnet, die verwendet wird, wenn die Information im Videotitelsatz verwendet wird, oder Information, die exklusiv verwendet wird.
Der Videomanager 71 wird nachstehend mit Bezug auf 14 beschrieben.
Der Videomanager 71 besteht aus Videomanagerinformation (VMGI) 75, einem Videoobjektsatz für ein Videomanager-Informationsmenü (VMGM_VOBS) 76 und ein Backup der Videomanagerinformation (VMGI_BUP) 77.
Im VMGM_VOBS 76 sind Videodaten, Audiodaten und Überlagerungsbilddaten für das Menü, das dem Volumen der optischen Platte zugeordnet ist, gespeichert. Das VMGM VOBS 76 kann beschreibende Information bereitstellen, die durch Stimmtöne und ein Überlagerungsbild in Zusammenhang mit jedem der Titel in Volumen gegeben ist, und die Auswahlanzeige für die Titel. Wenn englische Konversationen zum Erlernen von Englisch auf der optischen Platte aufgezeichnet sind, werden z. B. der Titelname jeder englischen Konversation und Beispiele einer Lektion wiedergegeben und angezeigt, während ein Themensong akustisch wiedergegeben wird und jedes Überlagerungsbild zeigt, welches Niveau welcher Text hat o.dgl. Die Lektionsnummern (Niveaus) werden als Auswahlpunkte, die von einem Zuhörer auszuwählen sind, angezeigt. Die VMGM VOBS 76 wird für eine solche Verwendung benutzt.
15 stellt beispielhaft einen Videoobjektsatz (VOBS) 82 dar.
Es gibt zwei Typen von Videoobjektsätzen für ein Menü und einen Typ von Videoobjektsatz für Videotitel, wobei die drei Typen ähnliche Strukturen aufweisen.
Der VOBS 82 ist als ein Satz von einem oder mehreren Videoobjekten (VOB's) 83 definiert, die für den gleichen Zweck verwendet werden. Normalerweise besteht der VOBS für ein Menü aus Videoobjekten (VOB's) zum Anzeigen mehrerer Menübildschirme, während der VOBS für einen Videotitelsatz aus VOB's zum Anzeigen normaler Bewegtbilder o.dgl. besteht.
Jedem VOB wird eine ID-Nummer (VOB IDN#j) zugeteilt, die zur Identifizierung dieses VOB benutzt wird. Ein VOB besteht aus einer Zelle oder mehreren Zellen 84. Desgleichen wird jeder Zelle eine ID-Nummer (C_IDN#j) gegeben, die zur Identifizierung dieser Zelle dient. Das Videoobjekt für ein Menü kann eine einzige Zelle umfassen.
Ferner besteht eine Zelle aus einer oder mehreren Videoobjekteinheiten (VOBU's). Eine einzelne VOBU ist als Sequenz von Packs mit einem Navigationspack (NV-Pack) an der Spitze definiert. Eine VOBU ist als Satz aller Packs definiert, die zwischen dem NV-Pack (einschließlich der vorher genannten DSI) und dem nächsten NV-Pack aufgezeichnet sind. Die Wiedergabezeit für die VOBU ist äquivalent zu der Wiedergabezeit für Videodaten, die aus einer einzelnen Bildgruppe (GOP = Group Of Pictures) oder mehreren GOP's besteht, die in diese VOBU aufgenommen sind, und wird als gleich oder größer als etwa 0,4 sec und gleich oder weniger als 1 sec definiert. Die MPEG-Standards definieren eine GOP als komprimierte Bilddaten, die der Wiedergabezeit von etwa 0,5 sec entsprechen. Gemäß den MPEG-Standards können etwa 0,5 sec Audioinformation und Bildinformation angeordnet werden.
Eine VOBU hat das vorgenannte NV-Pack am Anfang, gefolgt von Video-Packs (V-Packs), Überlagerungsbild-Packs (SP-Packs) und Audio-Packs (A-Packs), die in einer bestimmten Reihenfolge angeordnet sind. Mehrere V-Packs in einer VOBU weisen komprimierte Bilddaten auf, deren Wiedergabezeit gleich oder weniger als 1 sec beträgt, und zwar in der Form einer GOP oder mehrerer GOP's. Audiosignale, die dieser Wiedergabezeit entsprechen, werden komprimiert und als A-Packs angeordnet. Die in dieser Wiedergabezeit verwendeten Überlagerungsbilddaten werden komprimiert und als SP-Packs angeordnet. Es ist anzumerken, daß Audiosignale beispielsweise mit 8 Datenströmen als Pack aufgezeichnet werden, und Überlagerungsbilddaten mit beispielsweise 32 Datenströmen als Pack aufgezeichnet werden.
Ein Stream von Audiosignalen sind durch eine Art von Codiersystem codierte Daten und bestehen aus 8 Kanälen linearer PCM-quantisierter Daten n beispielsweise 20 Bits.
Wiederum gemäß 14 beschreibt die VMGI 75 Information zum Suchen nach einem Videotitel und umfaßt mindestens drei Tabellen 78, 79 und 80.
Eine Videomanagerinformations-Managementtabelle (VMGI_MAT) 78 beschreibt die Größe der VMG 71, die Startadresse jeder Information im Videomanager, dem Videoobjektsatz für ein Videomanagermenü (VMGM_VOBS) zugeordnete Attributinformation und dgl.
Eine Titel-Suchzeigertabelle (TT_SRPT) 79 beschreibt Eingangsprogrammketten (EPGC) der in dem Volumen der optischen Platte enthaltenen Videotitel, die gemäß der über die Tastenbetätigungs-/Anzeigesektion der Vorrichtung eingegebene Titelnummer auswählbar sind.
Im folgenden werden die Programmketten mit Bezug auf 16 erläutert. Jede Programmkette 87 ist ein Satz von Programmnummern zum Reproduzieren der Story eines bestimmten Titels, und ein Kapitel der Story eines Titels oder die Story selbst wird mit einer kontinuierlichen Reproduktion bzw. Wiedergabe von Programmketten ausgeführt. Eine Programmnummer besteht aus mehreren Zell-ID-Nummern, von denen jede eine Zelle in der VOBS spezifizieren kann.
Eine Videotitelsatz-Attributtabelle (VTS ART) 80 beschreibt Attributinformation, die von Videotitelsätzen (VTS') im Volumen der optischen Platte festgelegt ist. Die Attributinformation weist die Anzahl von VTS', die Nummer, das Videokompressionssystem, den Audiocodiermodus und den Anzeigetyp von Überlagerungsbildern auf.
Nach dem Paketsystem gemäß dieser Erfindung nach obiger Beschreibung sind Audiodaten am Beginn jedes Pakets immer der Beginn von Abtastdaten, und Pakete können als Einheiten behandelt werden, so daß die Zeitfolgeverarbeitung für die Verarbeitung von Audiodaten und eine Sequenz von Arbeitsabläufen dieser Zeitfolgeverarbeitung erleichtert wird.
Im folgenden wird eine Beschreibung des Audio- Decodierers gegeben, der Daten reproduziert bzw. wiedergibt, die in der oben beschriebenen Form angeordnet und aufgezeichnet sind.
17 zeigt die Basisstruktur des Audiodecodierers 513.
Der dargestellte Decodierer kann Daten in allen Moden für die in 8 gezeigten Anzahlen von Kanälen und Anzahlen von Bits von Abtastwerten reproduzieren. Eingabedaten sind so gestaltet, daß die Anzahl von Quantisierungsbits jedes von 8 Kanälen 24 Bits beträgt.
Eine Abtastwertsequenz, wie sie mit Bezug auf 1 erläutert wurde, wird kontinuierlich einem Eingabeanschluß 710 eingegeben. Diese Abtastwertsequenz wird in den Eingabeanschluß 711 eines Schalters SWO eingegeben. Der Schalter SWO weist Verteilungsanschlüsse für die einzelnen Abtastwerte der Kanäle An bis Hn und an bis hn auf. Die Anschlüsse, die Abtastwerten der einzelnen Kanäle zugeordnet sind, werden mit den gleichen Bezugsziffern wie repräsentative Abtastwerte versehen. Die repräsentativen Abtastwerte sind Abtastwerte AO bis H0, A1 bis H1, a0 bis h0 und a1 bis h1.
Es wird davon ausgegangen, daß die Anschlüsse AO bis HO und A1 bis H1 16-Bit-Anschlüsse und die Anschlüsse a0 bis h0 und a1 bis h1 4-Bit-Anschlüsse sind. Der zusätzliche Abtastwert kann aus insgesamt 8 Bits bestehen, so daß zwei Sätze von 4-Bit-Anschlüssen, a0 bis h0 und a1 bis h1 erstellt werden. Der 16-Bit-Anschluß AO ist mit den oberen Bits (16 Bits) eines Speichers MAO verbunden, und die zugeordneten 4-Bit-Anschlüsse a0 und a0 sind mit den unteren Bits (8 Bits) des Speichers MAO über betreffende Schalter j1 und j2 verbunden. Der 16-Bit-Anschluß BO ist über einen Schalter JB mit den oberen Bits eines Speichers MBO verbunden, und die zugeordneten 4-Bit-Anschlüsse b0 und b0 sind mit den unteren Bits des Speichers MBO über betreffende Schalter j1 und j2 verbunden. Der 16-Bit-Rnschluß CO. ist über einen Schalter JC mit den oberen Bits eines Speichers MCO verbunden, und die zugeordneten 4-Bit-Anschlüsse c0 und c0 sind mit den unteren Bits des Speichers MCO über betreffende Schalter j1 und j2 verbunden. Ebenso sind die anderen Anschlüsse D0 bis HO, D1 bis H1, d0 bis h0 und d1 bis h1 mit den zugeordneten Speichern MDO bis MH1 verbunden.
Infolgedessen werden die einzelnen Kanäle auf die Speicher MAO bis MH1 verteilt. Die Ausgangsanschlüsse der Speicher MAO und MA1 sind mit den Anschlüssen TRO, TaO, TaO, TA1, Ta1 und Ta1 eines A-Kanal-Ausgangsschalters SWA verbunden. TAO und TA1 sind 16-Bit-Anschlüsse, und TaO, TaO, Ta1 und Ta1 sind 4-Bit-Anschlüsse. Auf ähnliche Weise sind die Ausgangsanschlüsse der Speicher MBO und MB1 mit den Anschlüssen TBO, TbO, TbO, TB1, Tb1 und Tb1 eines B-Kanal-Ausgangsschalters SWB verbunden. TBO und TB1 sind 16-Bit-Anschlüsse, und TbO, TbO, Tb1 und Tb1 sind 4-Bit-Anschlüsse. Die Ausgangsanschlüsse der anderen Speicher sind ebenso mit den zugeordneten Ausgangsschaltern verbunden.
Im folgenden wird die Arbeitsweise des Audio-Decodierers 513 erläutert.
Abtastwerte S0, S1, e0, e1, ..., die für Aufzeichnungs-/Übertragungszwecke angeordnet sind, und in den Schalter SWO einzugeben sind, können als AO, BO, ..., HO, A1, B1,..., H1, a0, b0, ... b0 a1, b1,..., h0 als Beispiele der einzelnen Kanäle ausgedrückt werden. Jedes der Hauptwörter jedes Kanals besteht aus 16 Bits, und jedes Zusatzwort besteht aus 8 Bits. Angenommen, die Schalter des Schaltkreises sind alle geschlossen. Wenn der Drehschalter SWO der Reihe nach vom obersten Kontakt aus geschaltet wird, werden zugeordnete Abtastwerte an die Speicher MAO bis MH1 übertragen. Auf diese Weise werden Doppelpaare von Abtastwerten zyklisch. in den Speichern MA0 bis MH1 durch die Betätigung des Drehschalters SW0 gespeichert. Anschließend werden Abtastwerte des gewünschten Kanals unter diesen in den Speichern MAO bis MH1 gespeicherten Abtastwerten über den zugeordneten Drehschalter gelesen. Der Hauptabtastwert und der zusätzliche Abtastwert in jedem Leseabtastwert werden decodiert und dann für die nachfolgende Verarbeitung kombiniert.
Es wird nun auf das Lesen des Kanals A eingegangen. Mit dem Drehschalter SWR an der obersten 16-Bit-Kontaktposition wird der 16-Bit-Abtastwert AO gelesen. Dann werden Abtastwerte a0 mit einer Gesamtzahl von 8 Bits an zwei 4-Bit-Kontaktpositionen gelesen. An der nächsten 16-Bit-Kontaktposition wird der 16-Bit-Abtastwert A1 gelesen. Dann werden Abtastwerte mit einer Gesamtzahl von 8 Bits an zwei 4-Bit-Kontaktpositionen gelesen. Wenn sich der Drehschalter SWA einmal dreht, werden Doppelpaare von Abtastwerten AO, a0 und A1, a1 des Kanals A ausgelesen. Auf diese Weise werden Doppelpaare. von Abtastwerten des Kanals A in einer zeitlich sequentiellen Form erhalten. Danach werden hinsichtlich der anderen Kanäle B, C usw. Abtastwerte ebenfalls gelesen. Da Doppelpaar e, von Abtastwerten jedesmal verarbeitet werden, wenn die Drehschalter SWO, SWA, ..., und SWH eine Umdrehung ausführen, sollte die Drehperiode die Hälfte der Abtastfrequenz (fs/2) betragen.
18 stellt eine weitere Ausführungsform des Audiodecodierers dar.
Die dargestellte Ausführungsform verarbeitet Daten in dem Fall, in dem zwei Kanäle vorhanden sind und die Anzahl von Quantisierungsbits jedes Abtastwerts 20 Bits beträgt. Diese Schaltung unterscheidet sich von der in 17 gezeigten in den Zuständen der Schalter JB-JH, j1 und j2. Daher werden die gleichen Bezugsziffern denjenigen Komponenten zugeteilt, die mit den entsprechenden Komponenten der Schaltung in 17 gleich sind.
Die Abtastwerte S0, S1, e0, e1 usw. werden ausgedrückt als AO, BO, A1, B1, a0, b0, a1, b1 usw. als Abfolge von Abtastwerten der einzelnen Kanäle. Jeder Hauptabtastwert jedes Kanals besteht aus 16 Bits und jeder zusätzliche Abtastwert besteht aus 8 Bits.
Wie dargestellt ist, wird nur der Schalter JB geschlossen, und die Schalter JC bis JH sind offen. Hinsichtlich der Schalter j2 und j2, die den zusätzlichen Abtastwerten a0, b0, a1 und b1 zugeordnet sind, sind nach der Darstellung nur die Schalter j1 geschlossen und die anderen Schalter geöffnet. Diejenigen Schalter j1 und j2, die den anderen zusätzlichen Abtastwerten c0,..., h0, c1,..., h1 zugeordnet sind, sind alle offen.
Wenn der Drehschalter SWO Eingabedaten synchron mit der Dateneingabe verteilt, sind zu übertragende Daten AO, BO, A1, B1, a0 (4 Bits) , b0 (4 Bits) , a1 (4 Bits) und b1 (4 Bits) . Die Betätigung des Drehschalters SWO ermöglicht es, daß die Abtastwerte nur in die Speicher MAO, MBO, MA1 und MB1 in der dargestellten Reihenfolge eingegeben werden.
Auf der Ausgabeseite werden Ausgaben von denjenigen der Speicher MAO bis MH1 erhalten, die den Kanälen A und B zugeordnet sind. Von den den anderen Kanälen zugeordneten Speichern werden Daten 0 ausgegeben. Von den Schaltern j1 und j2 auf der Leseseite sind die Schalter j1 geschlossen und die Schalter j2 geöffnet. Demgemäß wird ein 4-Bit-Zusatzabtastwert einem 16-Bit-Hauptabtastwert folgend ausgelesen. Hinsichtlich des Kanals A werden beim Schalten des Schalters SWA Daten des Kanals A sequentiell in der Reihenfolge AO, a0 (4 Bits) A1 und a1 (4 Bits) ausgegeben. Die Einstellungen der einzelnen Schalter und die Schaltvorgänge in der oben beschriebenen Ausführungsform sind programmierbar gemäß der Anzahl von Kanälen von Audiostreams und der Anzahl von Quantisierungsbits jedes Abtastwerts eingestellt. Ein solcher Signalverarbeitungsmodus ist in der Videotitelsatz-Attributtabelle gemäß 14 und dem in 7 gezeigten Paket-Header beschrieben. Mit anderen Worten werden Audiodaten, die in einem lineare PCM-Daten darstellenden Audiopaket enthalten sind, die Audioframenummer, die Anzahl von Quantisierungsbits, die Abtastfrequenz, die Audio-Kanalnummer etc. beschrieben.
Die in den 17 und 18 dargestellten Decodierer können alle Moden bewältigen und sind sogenannte Volldecodierer, die auf eine Maschine höherer Klasse einstellbar sind, welche alle Kanäle reproduzieren kann.
Das Konzept dieser Erfindung bezieht sich auf ein Datenanordnungsverfahren, ein Aufzeichnungs-/Reproduktionsverfahren und eine Bearbeitungsvorrichtung, die verschiedene Arten von Moden bewältigen kann, welche durch vielerlei Kombinationen der Anzahl von Kanälen und der Anzahl von Quantisierungsbits entstehen. Die Datenanordnung kann der vorgenannten hochklassigen Maschine ebenso wie einer minderklassigen Maschine angepaßt werden, welche dem Erfordernis niedriger Kosten entspricht, z. B. einer Maschine, die nur 16-Bit-Daten von zwei Kanälen in jedem Modus reproduziert. Eine solche Maschine weist vorteilhafterweise einen kleineren Schaltkreisumfang auf als die hochklassige Maschine.
Die Schalter, die dazu verwendet werden, einzelne Abtastwerte zu verteilen und Rbtastwerte von zugeordneten Speichern abzurufen, sind zwar als mechanische Schalter dargestellt, sie bestehen jedoch alle aus elektronischen Schaltungen.
Es wird nun ein Audio-Decodierer in einem minderklassigen Abspielgerät beschrieben. Dieser Audio-Decodierer verarbeitet 16-Bit-Daten nur der Kanäle A und B. Eingabe-Abtastwerte sind aus 8 Kanälen und die Anzahl von Quanitisierungsbits beträgt 24 Bits.
Eine Sequenz von Abtastwerten, wie sie mit Bezug auf die 1 erläutert wurde, wird kontinuierlich an einen Eingabeanschluß 810 in 19 eingegeben. Diese Abtastwertsequenz wird dem Eingabeanschluß 811 eines Schalters SWO eingegeben. Der Schalter SWO weist Verteilungsanschlüsse für die individuellen Abtastwerte der Kanäle An bis Hn und an bis hn auf. Die Anschlüsse, die den Abtastwerten der einzelnen Kanäle zugeordnet sind, tragen die gleichen Bezugsziffern wie repräsentative Abtastwerte, wie die Abtastwerte AO bis HO, A1 bis H1, a0 bis h0 und a1 bis h1.
Es wird davon ausgegangen, daß die Anschlüsse AO bis HO und A1 bis H1 16-Bit-Anschlüsse sind, und die Anschlüsse a0 bis h0 und a1 bis h1 4-Bit-Anschlüsse. Da der zusätzliche Abtastwert aus einer Gesamtzahl von 8 Bits bestehen kann, werden zwei Sätze von 4-Bit-Anschlüsse, AO bis HO und a1 bis h1 erstellt.
In diesem Decodierer sind jedoch nur die Anschlüsse AO und A1 sowie BO und B1 jeweils mit den Speichern MA und MB verbunden, wobei die anderen Anschlüsse CO bis HO und c0 bis h0 geerdet sind. Der Schalter SWO kann auf diese Weise gestaltet sein; oder er kann so gestaltet sein, daß er von Beginn an nur zwei dieser Systeme den Kanälen A und B zugeordnet hat.
Die Schalter SWA und SWB dienen zum Lesen von Daten aus den Speichern MA und MB in Einheiten von 16 Bits. Die Schalter SWA und SWB arbeiten derart, daß Ausgabedaten miteinander übereinstimmen.
Die Arbeitsweise dieses Audio-Decodierers wird nun erläutert.
Abtastwerte S0, S1, e0, e1,..., die für den Aufzeichnungs-/Übertragungszweck angeordnet sind und am Schalter SWO einzugeben sind, können als AO, BO,..., HO, A1, B1,..., H1, a0, b0,..., h0, a1, b1,..., h0 als Abtastwerte der einzelnen Kanäle ausgedrückt werden. Jeder Hauptabtastwert jedes Kanals besteht aus 16 Bits und jedes zusätzliche Wort besteht aus 8 Bits. Die Schalter der Schaltkreise sind alle geschlossen. Wenn der Drehschalter SWO sequentiell vom obersten Kontakt aus geschaltet wird, werden die zugeordneten Abtastwerte an die Speicher MAO und MB1 übertragen. Die anderen Abtastwerte werden alle entfernt.
Anschließend werden die in den Speichern MAO und MB1 gespeicherten Abtastwerte hinsichtlich der Kanäle A und B gelesen.
Da zwei Abtastwerte bei einer einmaligen Drehung des Drehschalters SWO verarbeitet werden, sollte die Drehperiode die Hälfte der Abtastfrequenz fs betragen. Da ein Abtastwert gelesen wird, wenn sich jeder der Drehschalter SWA und SWB einmal dreht, ist die Frequenz fs.
Ein weiterer Audio-Decodierer in einem minderklassigen Abspielgerät wird nun erläutert. Dieser Audio-Decodierer verarbeitet 16-Bit-Daten nur der Kanäle A und B. Eingabe-Abtastwerte sind aus zwei Kanälen und die Anzahl von Quantisierungsbits beträgt 20 Bits.
Eine Abfolge von Abtastwerten, wie sie mit Bezug auf 1 erläutert wurde, wird kontinuierlich in dem Eingabeanschluß 810 in 20 eingegeben. Diese Abtastwertsequenz wird an den Eingabeanschluß 811 des Schalters SWO angelegt. Der Schalter SWO weist Verteilungsanschlüsse für die einzelnen Abtastwerte der Kanäle An bis Hn und an bis hn auf. Die Anschlüsse, die Abtastwerten der einzelnen Kanäle zugeordnet sind, tragen die gleichen Bezugsziffern wie repräsentative Abtastwerte, d. h. wie die Abtastwerte AO, BO, A1, B1, a0, b0, a1 und b1.
Die Anschlüsse AO, BO, A1 und B1 sind 16-Bit-Terminals und die Anschlüsse a0, b0, a1 und b1 sind 4-Bit-Terminals. Um die Moden von zwei Kanälen und die Quantisierungsbits von 20 Bits zu bewältigen; ist nur der Schalter JB geschlossen und die Schalter JC bis JH sind geöffnet. Diejenigen Schalter j1 und j2, die den Anschlüssen a0, b0, a1 und b1 zugeordnet sind, sind geschlossen, und die den anderen Anschlüssen zugeordneten Schalter j3 bis j16 sind geöffnet.
Wenn der Drehschalter SWO in der obigen Situation sequentiell geschaltet wird, findet keine Datenübertragung statt. Es werden nur die Hauptabtastwerte AO, BO, A1 und B1 an die Speicher MA und MB übertragen. Was die zusätzlichen Abtastwerte a0, b0, a1 und b1 betrifft, so werden diese zusätzlichen Abtastwerte entfernt, da ihre zugeordneten Schalter geerdet sind. Die Funktion des Lesens von Abtastwerten aus den Speichern MA und MB wird auf die gleiche Art und Weise ausgeführt, wie bei der vorher beschriebenen Ausführungsform.
Die vorhergehende Beschreibung der minderklassigen Maschine erfolgte zwar mit Bezug auf zwei Moden, es können jedoch auch Daten von zwei Kanälen in jedem Modus gemäß der selektiven geöffneten oder geschlossenen Zustände der Schalter abgerufen werden. Der spezielle Punkt, der anzumerken ist, ist der, daß die Verarbeitung für zusätzliche Abtastwerte 8 Bits um 8 Bits ausgeführt wird. Die oben beschriebene Datenanordnung läßt die Anzahl von Bits eines Paars von zusätzlichen Abtastwerten ein ganzzahliges Vielfaches von 8 Bits werden, ungeachtet der Anzahl von Kanälen, selbst wenn jedes zusätzliche Wort jedes Kanals aus 4 Bits besteht. Selbst wenn zusätzliche Abtastwerte in einem Low-Class-Decodierer entfernt werden müssen, ist daher eine 8-Bit-Verarbeitung möglich.
Da die Hauptworte von zusätzlichen Abtastwerten jeweils aus 16 Bits bestehen, können sie alle 8 Bits um 8 Bits verarbeitet werden, was bei der Gestaltung einer spezifischen Schaltung sehr vorteilhaft ist.
Jedes Audio-Pack hat einen Pack-Header. Wie 21 zeigt, besteht der Pack-Header aus einem Pack-Startcode (4 Bytes), einer System-Taktreferenz (SCR) (6 Bytes), einer Programm-Multiplexrate (3 Bytes) und einer Pack-Stopflänge (1 Byte). Der SCR stellt die Zeit dar, die zum Abruf dieses Audio-Packs erforderlich ist. Falls der Wert, den SCR darstellt, kürzer: ist als ein Bezugswert in der Plattenabspielvorrichtung, wird das Audio-Pack in dem Audio-Puffer gespeichert. Die Steuerschaltung bezieht sich auf eine Pack-Stopflänge und bestimmt eine Leseadresse auf der Basis der Pack-Stopflänge.
22 zeigt den Inhalt des Paket-Headers eines Audio-Pakets. Der Paket-Header umfaßt ein Packet Start Code-Prefix, das den Start eines Pakets angibt, eine Stream-ID, die angibt, welche Daten das Paket hat, und Daten, welche die Länge des Paket-Streams angeben. Im Paket-Header sind auch verschiedene Arten von Informationen eines Paket-Elementar-Streams (PES = packet elementary stream) beschrieben, wie z. B. ein Flag, das das Verbot oder die Erlaubnis des Kopierens angibt, ein Flag, das angibt, ob die Information eine originale oder eine kopierte ist, sowie die Länge des Paket-Headers. Ein Darstellungs-Zeitprotokoll (PTS = presentation time stamp) für die Synchronisierung des Ausgabe-Timings dieses Pakets mit derjenigen von anderen Videodaten oder Überlagerungsbilddaten ist außerdem in dem Paketheader beschrieben. Weitere Information, wie z. B. ein Flag, das angibt, ob es eine Beschreibung eines Puffers gibt, und das die Puffergröße angibt, ist im ersten Paket im ersten Feld in jedem Videoobjekt beschrieben.
Der Paket-Header weist auch Stopf-Bytes von 0 bis 7 Bytes auf. Der Paket-Header hat ferner eine Sub-Stream-ID, die einen Audio-Stream, lineare PCM oder einen anderen Kompressionstyp sowie die Anzahl von Audio-Streams angibt. Ferner sind im Paket-Header die Anzahl von Frames von Audiodaten, deren erstes Byte in diesem Paket gelegen ist, beschrieben. Darüber hinaus ist ein Zeiger (pointer) für eine Einheit, auf die als erste zuzugreifen ist, durch die Anzahl von logischen Blöcken vom letzten Byte dieser Information beschrieben. Somit gibt der Zeiger den ersten Audioframe an, der als erster zu der von der PTS beschriebenen Zeit decodiert werden soll. Der Zeiger gibt die erste Byte-Adresse dieses Audioframes an. Ferner sind in dem Paket-Header ein Audio-Betonungsflag, das angibt, ob beim Hochfrequenzband betont werden soll oder nicht, ein Stumm-Flag zum Bereitstellen eines Stumm-Status, wenn Audioframe-Daten alle 0 sind, und eine Framenummer, welche den Frame in einer Audioframe-Gruppe (GOF) angibt, auf den als erster zuzugreifen ist, beschrieben. Steuerinformation, wie z. B. die Länge eines quantisierten Worts oder die Anzahl von Quantisierungs-Bits, die Abtastfrequenz, die Anzahl von Kanälen und der dynamische Bereich sind ebenfalls beschrieben.
Die obige Header-Information wird durch eine Decodierer-Steuersektion (nicht dargestellt) im Audio-Decodierer analysiert. Die Decodierer-Steuersektion schaltet die Signalverarbeitungsschaltung im Decodierer auf den Signalverarbeitungsmodus, der aktuell abgerufenen Audiodaten zugeordnet ist. Die Schaltungsmoden werden mit Bezug auf die 17 bis 20 erläutert. Information wie diese Header-Information ist auch im Videomanager beschrieben, so daß, wenn eine solche Information im Anfangsstadium des Reproduktions- bzw. Wiedergabevorgangs gelesen wird, die Information danach für die Wiedergabe des gleichen Sub-Streams nicht nochmals gelesen werden muß. Der Grund, warum Modusinformation, die zur Reproduktion von Audiodaten notwendig ist, im Header jedes Pakets nach obiger Beschreibung beschrieben ist, besteht darin, daß ein empfangender Anschluß den Modus der Audiodaten immer dann identifizieren kann, wenn ein Empfang im Fall der Übertragung einer Sequenz von Paketen über einen Kommunikationspfad startet.
23 ist ein Blockdiagramm des in die Plattenabspielvorrichtung eingegliederten Audiodaten-Verarbeitungssystems, das die Systemverarbeitungssektion 504, und den Audio-Decodierer 513 detaillierter darstellt als in 10.
In der Systemverarbeitungssektion 504 wird ein Eingabe-Hochfrequenzsignal (Lesesignal) einem Sync-Detektor 601 zugeführt. Der Detektor 601 erfaßt und Zusatzhiert ein Sync-Signal aus dem Lesesignal und erzeugt ein Timing-Signal. Das Lesesignal, das nun kein Sync-Signal enthält; wird in einen 8-16-Demodulator 602 eingegeben, welcher das 16-Bit-Signal in eine Abfolge von 8-Bit-Daten demoduliert. Die 8-Bit-Daten werden einer Fehlerkorrekturschaltung 603 eingegeben. Die Datenausgabe aus der Schaltung 603, die fehlerfrei ist, wird in einen Demultiplexer 604 eingegeben. Der Demultiplexer 604 verarbeitet die Daten, wobei er das Video-Pack, das Überlagerungsbild-Pack und das Audio-Pack gemäß der Referenz der Stream-ID erkennt. Diese Packs werden vom Demultiplexer 604 dem Video-Decodierer 508, dem Überlagerungsbild-Decodierer 509 und dem Audio-Decodierer 513 zugeführt.
Dabei wird das Audio-Pack in einen Audiopuffer 611, gegeben und der Pack-Header sowie Paket-Header des Audio-Packs werden in eine Steuerschaltung 612 gegeben. Die Steuerschaltung 612 erkennt den Inhalt des Audio-Packs, d. h. den Start-Code, die Stopflänge, den Paket-Startcode und die Stream-ID des Audiopacks. Ferner erkennt die Steuerschaltung 612 die Substream-ID, den ersten Zugriffspunkt, die Anzahl quantisierter Audiobits, die Anzahl von Kanälen und die Abtastfrequenz. Die Stopfbyte-Länge und die Füllpaketlänge werden aus diesen so erkannten Datengrößen auf der Basis der in 4 dargestellten Tabelle bestimmt.
Die Steuerschaltung 612 erkennt das Paket der linearen PCM auf der Basis der Substream-ID.
Infolgedessen kann die Steuerschaltung 612 die Zusatzktionsadresse der Audiodaten, die im Audiopuffer 611 gespeichert ist, identifizieren. Wenn er durch die Schaltung 612 gesteuert wird, gibt der Audiopuffer 611 Abtastwerte wie z. B. die Abtastwerte S0, S1, e0, e1, S2, S3, ..., aus. Die Steuerschaltung 612 kann die Anzahl von Stopfbytes und/oder die Anzahl von Füllpaketen erkennen, sobald sie mindestens die Anzahl quantisierter Bits, die Abtastrate und die Anzahl von Audiokanälen erkannt hat. Die Schaltung 612 kann Daten auf der Basis dieser so erkannten Datengrößen Zusatzhieren.
Die vom Audiopuffer 611 ausgegebenen Rbtastwerte werden einem Kanalprozessor 613 zugeführt. Der Prozessor 613 weist eine Struktur des in 17 bis 20 gezeigten Typs auf. Sein Betriebsmodus wird durch die Steuerschaltung 612 gesteuert.
Das Audiopaket, das Videopaket, das Überlagerungsbildpaket und die Aufzeichnungsspuren der optischen Platte, die alle oben beschrieben wurden, haben eine spezifische physische Beziehung, die nachstehend erläutert wird.
Wenn ein Teil der Aufzeichnungsfläche einer optischen Platte 10 gemäß 24A vergrößert wird, erkennt man Pit-Abfolgen, wie sie in 24B veranschaulicht sind. Ein Satz von Pit-Abfolgen bildet einen Sektor, wie aus 24C und 24D zu erkennen ist, die zwei weitere vergrößerte Ansichten der optischen Platte 10 sind. Die Sektoren werden sequentiell durch den optischen Kopf gelesen. Anschließend werden die Audiopakete in Echtzeit reproduziert.
Im folgenden werden die Sektoren mit Bezug auf die 25A und 25B beschrieben. Wie 25B zeigt, besteht ein Sektor, in dem Audiodaten aufgezeichnet sind, aus 13 x 2 Frames. Jedem Sektor ist ein Sync-Code zugewiesen. Obwohl die Frames in 25B so dargestellt sind, als ob sie sequentiell in Reihen und Spalten angeordnet wären, sind sie sequentiell in einer einzigen Reihe auf einer Spur angeordnet. Genauer gesagt, sind die Frames mit den Sync-Codes SYO, SY5, SY1, SY2, SY5,... in der genannten Reihenfolge angeordnet.
Der einem Rahmen zugewiesene Sync-Code besteht aus 32 Bits (16 Bits x 2), und die in einem Rahmen aufgezeichneten Daten bestehen aus 1456 Bits (16 Bits x 91). Dies bedeutet, daß der Sektor durch einen 16-Bit-modulierten Code ausgedrückt ist, da 16-Bit-Datengrößen, die durch Modulieren von 8 Bit-Datengrößen erhalten wurden, auf der optischen Platte aufgezeichnet sind. Jeder Sektor umfaßt auch einen aufgezeichneten modulierten Fehlerkorrekturcode.
26A zeigt einen Sektor, in dem 8-Bit-Datengrößen, die durch Demodulieren der in dem oben beschriebenen physischen Sektor aufgezeichneten 16-Bit-Datengrößen erhalten wurde. Die Datenmenge in diesem Sektor beträgt: (172 + 19) Bytes x (12 + 1) Linien. Jede Linie enthält einen 10-Byte-Fehlerkorrekturcode. Ein Korrekturcode ist für jede Linie vorgesehen. Wenn zwölf Korrekturcodes jeweils für zwölf Linien gesammelt sind, fungieren sie als Fehlerkorrekturcode für zwölf Spalten.
Die in einem aufzuzeichnenden/aufgezeichneten Sektor aufgezeichneten Daten werden zu einem Datenblock des in 26B gezeigten Typs, wenn das Fehlerkorrektursignal daraus entfernt wird. Der Datenblock besteht aus 2048-Byte-Hauptdaten, einer 6-Byte-Sektor-ID, einem 2-Byte-ID-Fehlererfassungscode, 6-Byte-Copyright-Managementdaten und einem 4-Byte-Fehlererfassungscode. Wie 26B zeigt, werden die Sektor-ID, der ID-Fehlererfassungscode und die Copyright-Managementdaten dem Kopf der Hauptdaten hinzugefügt, während der Fehlererfassungscode dem Ende der Hauptdaten hinzugefügt wird. Die 2048-Byte-Hauptdaten sind ein oben definiertes Pack. Ein Pack-Header, ein Paket-Header und Audiodaten sind in dem Pack in der vom Kopf des Packs aus genannten Reihenfolge beschrieben. Im Pack-Header und dem Paket-Header sind verschiedene Posten von Führungsinformation beschrieben, die zur Verarbeitung der Audiodaten verwendet werden.
Wie oben angegeben wurde, ist ein Paket, das aus auf spezifische Weise angeordneten Audio-Abtastwerten besteht, in jedem aufzuzeichnenden/aufgezeichneten Sektor auf der Platte aufgezeichnet. Der Audio-Decodierer kann lineare PCM-Daten in einer gewünschten Weise reproduzieren, obwohl die PCM-Daten in einem aufzuzeichnenden/aufgezeichneten Sektor aufgezeichnet sind. Dies liegt daran, daß der Startteil der in jedem Pack enthaltenen Audiodaten der Startteil des Hauptabtastwerts ist, und auch daran, daß der Pack-Header und der Paket-Header Steuerdaten enthalten, die ausreichen, damit der Audio-Decodierer Audiodaten verarbeitet.
Ein ECC-Block (ECC = error-correction Code) wird im folgenden mit Bezug auf die 27A und 27B beschrieben. Wie 27A zeigt, besteht der ECC-Block aus 16 aufzuzeichnenden/aufgezeichneten Sektoren. Wie 26A zeigt, kann jeder Sektor 12 Datenzeilen aufzeichnen, wobei jede Zeile eine 127-Byte-Datengröße ist. Jeder Spalte wird eine äußere Parität von 16 Byte hinzugefügt, und jeder Zeile wird eine innere Parität (PI) von 10 Bytes hinzugefügt. Wie 27B zeigt, ist die äußere Parität (PO) von 16 Byte auf 1 Bit für jede Zeile verteilt. Infolgedessen enthält ein aufzuzeichnender/aufgezeichneter Sektor 13 Zeilen (12 + 1) von Daten. In 27A gibt "BO, 0, BO, 1, ..." Adressen. von Bytes an. In 27B bezeichnet "0, 1, 2, ... 15" jeweils die 16 aufzuzeichnenden/aufgezeichneten Sektoren.
Die Video-Packs, Überlagerungsbild-Packs und Audio-Packs sind auf der Spur der Platte verschachtelt. Diese Erfindung ist jedoch nicht auf diese Anordnung der Packs beschränkt. Diese Erfindung kann auf die Platte angewandt werden, auf der nur die Audio-Packs angeordnet sind, oder auf die Platte, auf der Audio-Packs und Überlagerungsbild-Packs angeordnet sind, oder auf die Platte, in der Audio-Packs, Überlagerungsbild-Packs und NV-Packs angeordnet sind. Die Packs können frei miteinander kombiniert werden.

Claims

Datenanordnungsverfahren zum Aufzeichnen oder Übertragen quantisierter Daten, die durch Abtasten eines Kanalsignals oder von Multikanalsignalen in einer zeitlich sequentiellen Weise erhalten wurden, wobei das Verfahren folgende Schritte umfaßt: Trennen bzw. Unterteilen von M-Bit-Abtastdaten jedes Kanalsignals in ein Hauptwort, das aus m1 Bit auf einer MSB-Seite (MSB = Most Significant Bit) besteht, und ein Zusatzwort, das aus m2 Bit auf einer LSB-Seite (LSB = Least Significant Bit) besteht, Anordnen einer Gruppe von Hauptwörtern der 2n-ten-Abtastdaten individueller Kanäle als eine Hauptabtastung 52n, anschließendes Anordnen einer Gruppe von Hauptwörtern von (2n + 1 - 2k)-ten Abtastdaten individueller Kanäle als eine Hauptabtastung S2n + 1 - 2k, anschließendes Anordnen einer Gruppe von Zusatzwörtern der 2n-ten Abtastdaten von individuellen Kanälen als eine Zusatzabtastung e2n, und anschließendes Anordnen einer Gruppe von. Zusatzwörtern von (2n + 1 - 2k)-ten Abtastdaten von individuellen Kanälen als eine Zusatzabtastung e2n + 1 - 2k, wobei n = 0, 1, 2,..., und k eine vorbestimmte ganze Zahl ungleich Null ist, und wobei die resultierenden Daten auf ein(em) Aufzeichnungsmedium aufgezeichnet oder übertragen werden.
Signalverarbeitungsvorrichtung zur Verwendung in einem System zum Aufzeichnen oder Übertragen quantisierter Daten, die durch Abtasten eines Kanals oder von Multikanalsignalen in einer zeitlich sequentiellen Weise erhalten werden, und zum Reproduzieren der quantisierten Daten, wobei die Vorrichtung umfaßt: Mittel zum Generieren von Daten mit einer Struktur, bei der M-Bit Abtastdaten jedes Kanalsignals in ein Hauptwort, das aus m1 Bit auf einer MSB-Seite (Most Significant Bit) besteht, und ein Zusatzwort, das aus m2 Bit auf einer MSB-Seite (Least Significant Bit) besteht, unterteilt sind, eine Gruppe von Hauptwörtern von 2n-ten Abtastdaten individueller Kanäle als eine Hauptabtastung S2n angeordnet ist, eine Gruppe von Hauptwörtern von (2n + 1-2k)-ten Abtastdaten von individuellen Kanälen dann als eine Hauptabtastung S2n + 1 - 2k angeordnet ist, eine Gruppe von Zusatzwörtern von 2n-ten Abtastdaten von individuellen Kanälen dann als eine Zusatzabtastung e2n angeordnet ist, und eine Gruppe von Zusatzwörtern von (2n + 1 - 2k)-ten Abtastdaten individueller Kanäle dann als eine Zusatzabtastung e2n + 1 - 2k angeordnet ist, wobei n = 0, 1, 2,..., und k eine vorbestimmte ganze Zahl ungleich Null ist, und wobei die resultierenden Daten auf ein em) Aufzeichnungsmedium aufgezeichnet oder übertragen werden.
Aufzeichnungsmedium, das quantisierte Daten enthält, die durch Abtasten eines Kanalsignals oder von Multikanalsignalen in einer zeitlich sequentiellen Weise erhalten wurden, wobei die Daten auf dem Aufzeichnungsmedium in einer Struktur aufgezeichnet sind, bei der M-Bit-Abtastdaten jedes Kanalsignals in ein Hauptwort, das aus ml Bit auf einer MSB-Seite (MSB = Most Significant Bit) besteht, und ein Zusatzwort, das aus m2 Bit auf einer LSB-Seite (LSB = Least Significant Bit) besteht, unterteilt sind, eine Gruppe von Hauptwörtern von 2n-ten Abtastdaten von einzelnen Kanälen als eine Hauptabtastung S2n angeordnet ist, eine Gruppe von Hauptwörtern von (2n + 1-2k)-ten Abtastdaten von einzelnen Kanälen als nächstes als eine Hauptabtastung S2n + 1 - 2k angeordnet ist, eine Gruppe von Zusatzwörtern der 2n-ten Abtastdaten von einzelnen Kanälen dann als eine Zusatzabtastung e2n angeordnet ist und eine Gruppe von Zusatzwörtern von (2n + 1 - 2k)-ten Abtastdaten von einzelnen Kanälen dann als eine Zusatzabtastung e2n + 1 - 2k angeordnet ist, wobei n = 0, 1, 2, ..., und k eine vorbestimmte ganze Zahl ungleich Null ist.
Signalverarbeitungsvorrichtung zum Verarbeiten quantisierter Daten, die durch Abtasten eines Kanalsignals oder von Multikanalsignalen in einer zeitlich sequentiellen Weise erhalten und in einer Struktur angeordnet wurden, bei der M-Bit-Abtastdaten jedes Kanalsignals in ein Hauptwort, das aus ml Bit auf einer MSB-Seite (MSB = Most Significant Bit) besteht, und ein Zusatzwort, das aus m2 Bit auf einer LSB-Seite (LSB = Least Significant Bit) besteht, unterteilt sind, eine Gruppe von Hauptwörtern der 2n-ten Abtastdaten von einzelnen Kanälen als eine Hauptabtastung S2n angeordnet ist, eine Gruppe von Hauptwörtern von (2n + 1 - 2k)-ten Abtastdaten von einzelnen Kanälen als nächstes als eine Hauptabtastung S2n + 1 - 2k angeordnet ist, eine Gruppe von Zusatzwörtern der 2n-ten Abtastdaten von einzelnen Kanälen dann als eine Zusatzabtastung e2n angeordnet ist und eine Gruppe von Zusatzwörtern von (2 + 1 - 2k)-ten Abtastdaten von einzelnen Kanälen dann als eine Zusatzabtastung e2n + 1 - 2k angeordnet ist, wobei n = 0, 1, 2, ..., und k eine vorbestimmte ganze Zahl ungleich Null ist, wobei die Vorrichtung umfaßt: eine Verzögerungs-Übertragungsstrecke mit einem Verzögerungsbetrag von 2k zum Empfangen nur der Hauptabtastungen S2n, ein verzögerungsloses Übertragungssystem zum Empfangen nur der Hauptabtastungen S2n + 1 - 2 k, und Mittel zum Erfassen einer reproduzierten Ausgabe der Übertragungsstrecke und zum Bereitstellen der ursprünglichen Abtastungsanordnung nur der Hauptworte der ml Bit.
Signalverarbeitungsvorrichtung zum Verarbeiten quantisierter Daten, die durch Abtasten eines Kanalsignals oder von Multikanalsignalen in einer zeitlich sequentiellen Weise erhalten und in einer Struktur angeordnet wurden, bei der M-Bit-Abtastdaten jedes Kanalsignals in ein Hauptwort, das aus ml Bit auf einer MSB-Seite (MSB = Most Significant Bit) besteht, und ein Zusatzwort, das aus m2 Bit auf einer LSB-Seite (LSB = Least Significant Bit) besteht, unterteilt sind, eine Gruppe von Hauptwörtern von 2n-ten Abtastdaten von einzelnen Kanälen als eine Hauptabtastung S2n angeordnet ist, eine Gruppe von Hauptwörtern von (2n + 1 - 2k)-ten Abtastdaten von einzelnen Kanälen als nächstes als eine Hauptabtastung S2n + 1 - 2k angeordnet ist, eine Gruppe von Zusatzwörtern der 2n-ten Abtastdaten von einzelnen Kanälen dann als eine Zusatzabtastung e2n angeordnet ist und eine Gruppe von Zusatzwörtern von (2n + 1-2k)-ten Abtastdaten von einzelnen Kanälen dann als eine Zusatzabtastung e2n + 1 - 2k angeordnet ist, wobei n = 0, 1, 2, ..., und k eine vorbestimmte ganze Zahl ungleich Null ist, wobei die Vorrichtung umfaßt: eine Verzögerungs-Übertragungsstrecke mit einem Verzögerungsbetrag von 2k zum Empfangen der Hauptabtastungen. S2n, ein verzögerungsfreies Übertragungssystem zum Empfangen der Hauptabtastungen S2n + 1 - 2k, eine Verzögerungs-Übertragungsstrecke mit einem Verzögerungsbetrag von 2k zum Empfangen der Zusatz-Abtastungen e2n, ein verzögerungsloses Übertragungssystem zum Empfangen von e2n + 1 - 2 k, und Mittel zum Erfassen einer reproduzierten Ausgabe der Übertragungsstrecken und zum Koppeln eines Hauptworts der ml Bit eines vorbestimmten Kanals mit einem Zusatzwort der m2 Bit eines zugeordneten Kanals, um die ursprüngliche Abtastungsanordnung bereitzustellen.