DE69921326T2 - TRANSKODIERER FÜR DATENSTRöME MIT FESTEN UND VERÄNDERLICHEN DATENRATEN - Google Patents

TRANSKODIERER FÜR DATENSTRöME MIT FESTEN UND VERÄNDERLICHEN DATENRATEN Download PDF

Info

Publication number
DE69921326T2
DE69921326T2 DE69921326T DE69921326T DE69921326T2 DE 69921326 T2 DE69921326 T2 DE 69921326T2 DE 69921326 T DE69921326 T DE 69921326T DE 69921326 T DE69921326 T DE 69921326T DE 69921326 T2 DE69921326 T2 DE 69921326T2
Authority
DE
Germany
Prior art keywords
data
rate
stream
decoder
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69921326T
Other languages
English (en)
Other versions
DE69921326D1 (de
Inventor
Graham Peter Lancing CRAVEN
James Malcolm Hove LAW
Robert John STUART
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9814513.9A external-priority patent/GB9814513D0/en
Priority claimed from GBGB9907918.8A external-priority patent/GB9907918D0/en
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of DE69921326D1 publication Critical patent/DE69921326D1/de
Application granted granted Critical
Publication of DE69921326T2 publication Critical patent/DE69921326T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00992Circuits for stereophonic or quadraphonic recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00021Time or data compression or expansion the compressed signal being an audio signal lossless audio compression
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/1062Data buffering arrangements, e.g. recording or playback buffers
    • G11B2020/10629Data buffering arrangements, e.g. recording or playback buffers the buffer having a specific structure
    • G11B2020/10638First-in-first-out memories [FIFO] buffers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B2020/1264Formatting, e.g. arrangement of data block or words on the record carriers wherein the formatting concerns a specific kind of data
    • G11B2020/1265Control data, system data or management information, i.e. data used to access or process user data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Description

  • Gebiet der Erfindung
  • Die Erfindung betrifft die Übertragung einer Aufzeichnung durch Mastering, Authoring und Auslieferung an den Verbraucher, wobei einige Glieder in der Kette eine Übertragung mit fester Datenrate erfordern, während für andere vorzugsweise eine variable Datenrate erforderlich ist, um die Gesamtdatenmenge zu verringern.
  • Hintergrund der Erfindung
  • Es ist bekannt, daß ein Audiosignal einem Komprimierungsverfahren (beispielsweise verlustfreier Komprimierung) unterworfen werden kann, mit dem ein komprimierter Strom von veränderlicher Datenrate erzeugt wird.
  • Bei einer Anwendung wie DVD sind zwei Parameter wichtig: die Spitzendatenrate und die Gesamtdatenmenge. Auf der DVD-Audio-Platte, wie sie gegenwärtig vorgeschlagen wird, darf die Spitzendatenrate 9,6 Mbit/s nicht übersteigen, da die Platte Daten nur so schnell abgeben kann. Bei 6-Kanal Tonaufzeichnungen mit einer 24-Bit Präzision und einer Abtastfrequenz von 96 kHz bedeutet diese Grenze eine beträchtliche Einschränkung. P.G. Craven & M.A. Gerzon "Lossless Coding for Audio Discs", J. Audio Eng. Soc., Bd. 44, Nr. 9, SS. 706-720 (September 1996), P.G. Craven, M.J. Law & J.R. Stuart, "Lossless Compression using IIR Prediction Filters", J. Audio Eng. Soc. (Abstracts), Bd. 45, Nr. 5, S. 404 (22. März 1997) (Vorabdruck 4415) und GB 2323754 beschreiben Verfahren, die darauf ausgerichtet sind, die Datenrate während Spitzenpassagen zu minimieren. Darüber hinaus ist die Gesamtdatenmenge auf der Platte auf 4,7 Gbyte begrenzt, so daß es vorteilhaft ist, wenn möglich, die Datenrate auf unter 9,6 Mbit/s zu verringern, um die größtmögliche Abspielzeit zu erhalten.
  • Der auf die Platte aufgezeichnete Strom muß also eine variable Rate haben, um die größtmögliche Spielzeit zu erzielen.
  • Andererseits gehen viele Protokolle für serielle Datenübertragung von einer festen Datenrate aus. Ferner kann ein Strom mit fester Rate eine viel einfachere Schnittstelle zu einem anschließenden Verarbeitungsblock haben. Die Daten werden typischerweise von einer Transportschicht gehandhabt, die über den internen Aufbau nichts weiß, und werden dann an einen Dekodierer oder sonstigen Verarbeitungsblock weitergegeben. Bei einer Verwirklichung in Software ist es üblich, einen Dekodierer aufzurufen, um einen Block aus Audioabtastwerten, beispielsweise 80 Abtastwerte, zu dekodieren. Wenn die Eingabe in den Dekodierer ein Strom mit fester Rate ist, kann die Transportschicht ebenso wie das Software-"Geschirr", welches den Datenfluß organisiert, die Datenrate kennen und infolgedessen dem Kodierer die richtige Bitanzahl der Eingabedaten bereitstellen, damit der Dekodierer einen Block dekodierter Abtastwerte hervorbringen kann. Aber im Fall mit der variablen Rate ist die erforderliche Anzahl Bits dem Geschirr nicht so leicht bekannt. Eine mögliche Lösung besteht darin, daß der Dekodierer eine dynamisch variierende Anzahl Abtastwerte vom Geschirr anfordert: dafür ist eine Kommunikation in zwei Richtungen nötig. Wenn der Kodierer die Größe und Ausrichtung der Blöcke kennt, die der Dekodierer zu dekodieren hat, kann der Kodierer alternativ Informationen in die Transportschicht des Stroms einfügen, die es dem Geschirr erlauben, die nötige Anzahl Bits an den Dekodierer weiterzuleiten, ehe der Dekodierer mit dem Dekodieren des Blocks beginnt. Dies ist das MPEG-Modell.
  • Eine Kommunikation in zwei Richtungen zwischen dem Dekodierer und der Transporschicht ist äußerst unzweckmäßig, wenn der Dekodierer von der Hardware getrennt ist, die die Wiedergaberate von der Platte und zugehöriges Puffern steuert (z.B. ist es eine getrennte Untereinheit eines Wiedergabegeräts, oder es ist ein getrennter Posten außerhalb eines Wiedergabegeräts). Das MPEG-Modell hat den Vorteil, daß es eine Kommunikation in zwei Richtungen vermeidet; aber in anderer Hinsicht führt es beträchtliche Komplikationen ein und begrenzt die Art und Weise, in der Dekodierer funktionieren, Keine der Lösungen mit variabler Rate ist problemlos.
  • Insgesamt ist ein komprimierter Strom kein homogener Bitstrom, sondern ist intern in Einheiten unterteilt, die eine gegebene Anzahl Audioabtastwerte wiedergeben, optimal 1000 bis 2000 Audioabtastwerte. Auf diese Einheiten wird hier als "Pakete" Bezug genommen: Für einen derartigen Datenblock wird im IEC 958 Transportprotokoll der Ausdruck "burst" benutzt und in Komprimierungssystemen, wie AC-3 oder MPEG werden Ausdrücke wie "frame" oder "sync frame" dafür benutzt. Das Paket beginnt mit einem "Paketkopf", der die Datenrate einschließen kann (oder die Anzahl Bits im Paket, was gleichwertig ist, wenn die Anzahl der durch das Paket wiedergegebenen Abtastwerte bekannt ist). Man könnte meinen, daß angesichts dieser Informationen die Transportschicht weiß, wie viele Bits auf jeder Stufe an das Wiedergabegerät gesendet werden müssen, so daß keine Notwendigkeit für eine Kommunikation in zwei Richtungen entsteht. Jedoch ist es allgemein unzweckmäßig, vom Dekodierer zu verlangen, daß er ein komplettes Paket von 1000 bis 2000 Abtastwerten bei jedem Aufruf dekodieren muß, und wenn der Dekodierer weniger Abtastwerte als das dekodiert, stellt sich erneut die Frage, wieviele Daten er für jeden Aufruf braucht. (Dieses Problem ist mit dem MPEG-Modell vermieden, da der Dekodierer ein komplettes Paket oder eine "Zugangseinheit" dekodieren muß, und die Paketlänge dann auf eine Größenordnung von 100 Abtastwerte reduziert werden kann. Allerdings gehen mit den kürzeren Paketen mehr Paketzusätze einher).
  • Es ist nichts Neues, daß ein Strom mit variabler Rate in einen Strom mit fester Rate umgewandelt werden kann, dessen Rate der Spitzenrate des Stroms mit variabler Rate gleicht, wenn einfach während Perioden mit weniger als der Spitzendatenrate mit Nullen (oder sonstigen Fülldaten) aufgefüllt wird. Ähnlich kann durch das Entfernen der Nullen oder Füllzeichen der Strom fester Rate wieder zurückverwandelt werden in einen Strom mit variabler Rate. Angenommen (wie es normal ist) alle Nullen (oder Füllzeichen) würden entfernt, dann gibt es einen einmaligen Strom variabler Rate, der dem Strom mit fester Rate "entspricht". In umgekehrter Richtung ist die Menge an Auffüllung, die hinzugefügt werden kann, willkürlich, so daß es viele Ströme mit fester Rate gibt, die einem Strom mit variabler Rate "entsprechen", von denen aber keiner eine Datenrate haben kann, die unterhalb der Spitzendatenrate des Stroms mit variabler Rate liegt.
  • In GB 2323754 wird allerdings ein Verfahren beschrieben, bei dem die Datenrate des Stroms mit fester Rate etwas geringer sein kann als die Spitzenrate eines Stroms mit variabler Rate, aus dem er abgeleitet wurde. Das wird erreicht durch "Neupaketierung", d.h. durch das Ausnutzen eines bestehenden FIFO-Puffers im Dekodierer, so daß, für kürzere Perioden, dem Dekodiererkern Daten mit höherer Rate zugeführt werden können als der des Eingabestroms. Das Ausmaß, um das die Datenrate kleiner ist als die Spitze des Stroms mit variabler Rate hängt von der Größe des FIFO-Puffers und der Art des Signals ab.
  • Zusammenfassung der Erfindung
  • Diese Probleme im Stand der Technik werden mit einem Kodierer gemäß Anspruch 1 überwunden. Vorteilhafte Ausführungsbeispiele sind in den abhängigen Ansprüche angegeben.
  • Kurzbeschreibung der Zeichnungen
  • Beispiele der vorliegenden Erfindung sollen nun unter Hinweis auf die beigefügten Zeichnungen beschrieben werden.
  • 1 zeigt in vereinfachter schematischer Form das Layout von Audiodaten, die auf einer DVD gespeichert sind;
  • 2 zeigt schematisch die Grundelemente eines MLP-Kodierers;
  • 3 zeigt schematisch die Grundelemente eines MLP-Dekodierers;
  • 4 zeigt schematisch die Grundelemente eines vereinfachten Zweikanal-MLP-Dekodierers;
  • 5 zeigt die Grundelemente in einem Kodier- und Dekodiersystem und stellt die beteiligten Verzögerungen dar;
  • 6 zeigt ein DVD-Wiedergabegerät, welches die Wahl hat, zu PCM-Audio zu dekodieren oder einen komprimierten Strom mit fester Rate auszugeben; und
  • 7 zeigt ein Mastering-System, gefolgt von einem Authoring-System zum Eingeben von Daten auf eine DVD.
  • Detaillierte Beschreibung der Erfindung
  • Die Verarbeitung von Audiodaten im DVD-Audioformat ist ein Beispiel für eine praktische Anwendung dieser Erfindung, und dieses spezielle Beispiel wird nachfolgend beschrieben.
  • Wie aus 1 hervorgeht, werden Daten auf einer DVD als eine Serie von Sektoren 2, beispielsweise aus 2 Kilobyte gespeichert. Einige dieser Sektoren sind Audiodaten zugeteilt, und einige sind Nichtaudiodaten zugeteilt, beispielsweise Videodaten. Wie beim MPEG-Modell sind die Audiodaten auf der Platte als eine Sequenz sogenannter Zugangseinheiten 4 angeordnet, die je eine kodierte Version einer sogenannten Präsentationseinheit aufweisen. Eine Präsentationseinheit ist ein Datenblock, der etwa 1 ms Audiodaten wiedergibt. Bei einer Abtastrate von 96 kHz umfaßt jede Präsentationseinheit 80 Abtastwerte digitaler Audiodaten, die mittels Pulscodemodulation (PCM) kodiert sind. Eine Zugangseinheit weist einen MLP sync, gefolgt von den Daten für einen oder mehr Teilströme auf. Unterschiedliche Teilströme enthalten Daten für unterschiedliche Lautsprecherkanäle.
  • Die Präsentationseinheiten sind verlustfrei zu Zugangseinheiten kodiert, wozu ein von der Anmelderin vorgeschlagenes Kodierschema angewandt wird, welches Gegenstand der britischen Patentanmeldung Nr. 9907918.8 ist, deren Priorität beansprucht wird. Dieses Schema wird "Meridian Lossless Packing" (MLP) genannt und führt zu Zugangseinheiten variabler Länge, typischerweise um 1 Kilobyte. Sie können auch über die Grenzen zwischen Plattensektoren hinausgehen. Diese Patentanmeldung betrifft gewisse Aspekte, die in MLP verwirklicht werden. Deshalb folgt eine allgemeine Erörterung von MLP, welches die Aspekte gemäß dieser Erfindung beinhaltet.
  • Allerdings sei darauf hingewiesen, daß MLP lediglich ein Beispiel eines Kodierschemas ist, welches angepaßt werden kann, damit diese Erfindung verwirklicht werden kann.
  • MLP ist ein verlustfreies Kodiersystem, welches eine Kernkomprimierungsmethode bietet, mit der die Datengröße und/oder Datenrate eines Tonobjektes reduziert wird. Ausgedrückt als Kodiereroperation kann dieser Kern in einem BIN oder einer binären Plattendatei verkörpert sein, die unmittelbar dekodierbar ist, um den Ursprungston wiederherzustellen. MLP-komprimierten Audiodaten wird dann normalerweise eine Paketierungsschicht in einer Weise gegeben, die dem Zieltransportverfahren angepaßt ist. Zu offensichtlichen Transportmechanismen gehört ein Rechnerplatte, DVD-Platte, SPDIF-Schnittstelle und FireWire-Schnittstelle. Für jeden von ihnen lassen sich Ströme mit fester Rate oder veränderlicher Rate vorstellen.
  • Für diese Transportsysteme ist MLP so strukturiert worden, daß die kernkodierten Audiodaten in Ströme fester Rate oder variabler Rate paketiert werden können, und daß ein Neupaketierer die MLP-kodierten Audiodaten zwischen den Transportvarianten und/oder zwischen Strömen fester Rate und variabler Rate umwandeln kann, ohne dazu einen Zwischenprozeß zum Dekodieren/Kodieren zu benötigen.
  • Der MLP-Bitstrom ist ein flexibles Format zum Beschreiben von Mehrkanal-Audiodaten. Eine große Anzahl von Kanälen mit hoher Abtastrate zu dekodieren ist allerdings immer rechnerisch eine herausfordernde Aufgabe. Folglich ist MLP in hierarchischer Weise definiert worden, so daß Dekodierer mit geringerer Fähigkeit die von ihnen benötigten Audiosignale leicht extrahieren und Teile überspringen können, die für fortschrittlichere Dekodierer bestimmt sind.
  • Der MLP-Bitstrom trägt eine Anzahl Teilströme, welche die Audiodaten enthalten. Die Anzahl der Teilströme hängt von der jeweiligen Anwendung ab. Zweikanal-Dekodierer brauchen beispielsweise nur den Teilstrom 0 zu dekodieren; Mehrkanal-Standarddekodierer müssen den Teilstrom 0, den Teilstrom 1 oder beide dekodieren. Insgesamt können zusätzliche Teilströme innerhalb des MLP-Stroms zur Benutzung durch fortschrittlichere Dekodierer vorgesehen sein.
  • Wie in 2 gezeigt, nimmt ein MLP-Kodierer die Eingangskanäle und teilt sie (möglicherweise nach Matrixbildung) in den verschiedenen Dekodiererklassen angemessene Gruppen. Jede Gruppe wird dann von einem Kodiererkern verarbeitet, um einen Teilstrom komprimierter Daten variabler Rate zu erzeugen.
  • Eine normale 5·11 Kanal-Platte hat sechs Kanäle, die von einem Standarddekodierer dekodiert werden können. Diese würden einer Matrixbildung unterzogen und in Gruppen von zwei und vier Kanälen aufgeteilt, wobei die Matrix so gewählt wird, daß das 2-Kanalsignal ein akzeptables Gemisch für den 2-Kanalzuhörer ist. Dann werden die beiden Gruppen jeweils von getrennten Kodiererkernen kodiert, um Teilströme 0 und 1 zu erhalten.
  • Der Kodierer leitet jeden Teilstrom durch einen FIFO-Puffer zum Paketierer, der die Teilströme verschachtelt, um den zusammengesetzten Bitstrom zu erzeugen, der aus einem regulären Strom der Zugangseinheiten besteht. Wahlweise können in diesem Zeitpunkt zusätzliche Daten hinzugefügt werden, und diese Daten können den Raum einnehmen, der sonst verschwendet würde.
  • In dem in 3 gezeigten generischen MLP-Dekodierer empfängt der Depaketierer die Pakete oder Zugangseinheiten und gewinnt die Teilströme wieder, die er in einen oder mehr FIFO-Puffer gibt. Wahlweise kann er auch in diesem Zeitpunkt mögliche zusätzliche Daten wiederherstellen. Die Daten in jedem FIFO-Puffer sind ein reiner Teilstrom, aus dem sämtliche Informationen auf Paketniveau entfernt sind.
  • Nach dem Puffern wird jeder Teilstrom einem Dekodiererkern zugeleitet. Im einfachen Fall, wo der Teilstrom die Daten für eine vollständig unabhängige Gruppe von Kanälen enthält, werden diese Kanäle vom Dekodiererkern wiederhergestellt. 3 zeigt den fortschrittlicheren Fall, bei dem die Matrixbildung im Kodierer Informationen über Teilstromgrenzen ausgebreitet hat. Ein einmaliges Merkmal von MLP ist die verlustfreie Matrixbildung, die eine exakte Wiederherstellung des ursprünglichen Signals ohne Rundungsfehler erlaubt, wie sie bei der normalen Verwendung von Matrizes zu erwarten wären.
  • Wie 2 und 3 zeigen, beinhaltet sowohl der Kodierer- als auch der Dekodiererkern je eine Matrix, tatsächlich eine verlustfreie Matrix. Im wesentlichen ermöglicht die Matrix, lineare Abhängigkeiten innerhalb der Gruppe von Kanälen auszunutzen, um die Datenrate zu verringern.
  • Wenn mehrere Teilströme die Daten für eine Gruppe von Kanälen tragen, trägt der letzte Teilstrom die nötigen Matrixkoeffizienten für die gesamte Gruppe. In dem in 3 gezeigten Beispiel trägt so der Teilstrom 1 die Daten für vier Kanäle und zusätzlich die Matrixkoeffizienten für sechs Kanäle. Der Dekodierer 1 unterzieht die vier Kanäle des Teilstroms 1 einer teilweisen Dekodierung, nimmt dann zwei teilweise dekodierte Kanäle vom Dekodierer 0 herein, und alle sechs Kanäle nehmen an der endgültigen Matrixbildung teil.
  • Auch der Teilstrom 0 enthält Matrixinformation, diese wird aber nur dann verwendet, wenn der Teilstrom 0 isoliert dekodiert wird, wie in 4 gezeigt. Daraus folgt, daß die aus dem Dekodieren des Teilstroms 0 allein resultierenden zwei Signale nicht mit den beiden ersten Signalen identisch sein müssen, die aus dem Dekodieren der Teilströme 0 und 1 resultieren. Dies ist der Schlüssel für wirtschaftliches Dekodieren einer Zweikanal-Abwärtsmischung. Mit anderen Worten, ein 6-Kanal Ursprungssignal kann aus einer 2-Kanal Abwärtsmischung plus vier weiteren Signalen wiederhergestellt werden. Jeder Kodiererkern produziert einen Teilstrom variabler Rate, wobei die Datenrate während Spitzen hoher Höhenenergie am größten ist. Die in 2 gezeigten FIFO-Puffer sind von entscheidender Bedeutung bei der Verringerung der Spitzendatenrate auf der Platte. Diese FIFO-Puffer im Kodierer füllen sich während Passagen mit Spitzendatenraten von den Kodiererkernen und leeren sich, wenn die Datenraten von den Kodiererkernen kleiner sind als die maximale Datenrate des Übertragungsmediums oder Trägers.
  • Dementsprechend füllen sich die FIFO-Puffer im Dekodierer (3) während Passagen niedrigerer Datenrate und leeren sich während Passagen der Spitzenrate, womit es möglich ist, den Dekodiererkernen Spitzendatenraten zu liefern, die größer sind als das Übertragungsmaximum.
  • Durch das Puffern wird eine Verzögerung eingeführt, und die Verzögerung ist veränderlich in dem Maß, in dem sich die Puffer füllen und leeren. In 5 sind die Verzögerungsaspekte hervorgehoben, die am Kodier-Dekodier-Prozeß beteiligt sind: es ist klar, daß wenn sich ein FIFO-Puffer im Kodierer füllt, der entsprechende FIFO-Puffer im Dekodierer sich leeren muß, damit die Gesamtverzögerung D konstant ist.
  • An typischen Audiosignalen schwankt die Datenrate beträchtlich über eine Periode von einigen wenigen -zig Millisekunden, und das FIFO-Puffern mit einer Gesamtverzögerung D im Größenordnungsbereich von 50-100 ms reduziert die Spitzendatenrate insgesamt um etwa 2 Bits pro Abtastwert. Das ergibt einen Vorteil von nahezu 1 Mbit/s für fünf mit 96 kHz abgetastete Kanäle.
  • Wenn die Übertragung nicht in Echtzeit stattfindet, wie das bei Plattenaufnahmen der Fall ist, muß die Gesamtverzögerung D beim Kodieren und Dekodieren nicht als relevanter Faktor berücksichtigt werden. Das wichtige Thema hinsichtlich der Operation ist die Dekodierlatenz, die einen unmittelbaren Einfluß auf den Warteschlangenverzug hat, den der Benutzer erfährt. Hierbei handelt es sich um die Zeit zwischen dem Moment, zu dem der Dekodierer erstmals den komprimierten Datenstrom empfängt und dem Moment, in dem er imstande ist, die dekodierten Abtastwerte zu erzeugen. Ein Hauptbestandteil hierbei ist die Pufferlatenz, bei der es sich einfach um die Verzögerung durch den FIFO-Puffer des Dekodierers handelt.
  • Die maximale Pufferlatenz bei Standardanwendung beträgt 75 ms, bei weitem am häufigsten ist jedoch die Dauer der Latenz ungefähr 1 ms. Das Füllen und Entleeren des FIFO-Puffers des Dekodierers geschieht unter der Kontrolle des Kodierers, der dafür sorgt, daß der Puffer des Dekodierers meistens leer ist (was eine sehr niedrige Pufferlatenz ergibt), sich jedoch unmittelbar vor Passagen füllt, die zur höchsten Rate komprimierter Daten führen, zum Beispiel eine, die einen Beckenschlag enthält. Also nur unmittelbar vor einem solchen Spitzenereignis ist die Pufferlatenz in der Nähe ihres maximalen Wertes.
  • Der Standarddekodierer kann mit 90.000 Byte Pufferspeicher versehen sein; aber ein Zweikanal-Dekodierer kann auch weniger als 3 kByte insgesamt benutzen. Das liegt daran, daß jeder Teilstrom getrennt gepuffert wird (1), und das Puffern aus einem abwärtsgemischten Teilstrom ohne Auswirkung auf die Datenrate entfernt werden kann.
  • Wenn man die Zeit berücksichtigt, die es braucht, die verschiedenen Köpfe zu finden, liegt die gesamte Dekodierlatenz bei 96 kHz zwischen 2 und 10 ms während normaler Passagen, mit einem schlimmsten Fall von 105 ms unmittelbar vor einer Spitze.
  • Beschreibungen einiger der bei MLP angewandten Grundsätze finden sich im Artikel "Lossless Coding for Audio Discs", J. Audio Eng. Soc., Bd. 44 Nr. 9 SS 706-720 (September 1996) und in WO 96/37048, veröffentlicht am 21. November 1996.
  • Kodierer- und Dekodiererkerne nutzen im wesentlichen Matrixtransformationen und Huffman-Kodieren und Dekodieren.
  • Die Matrixbildung wird angewandt, um die Abhängigkeit zwischen den Kanälen auf ein Minimum zu senken und dadurch die übertragene Gesamtdatenrate. Wenn zum Beispiel zwei Kanäle sich sehr ähnlich sind, ist es wirksamer, einen von ihnen und die Differenz zwischen beiden zu übertragen. Nicht angebracht ist es, wenn der Dekodierer einfach mit dem Umgekehrten der Matrix des Kodierers multipliziert, denn bei den Matrixmultiplikationen entstehende Rundungsfehler haben eine verlustbehaftete Wiederherstellung des Originals zur Folge. Dieses Problem wird durch die Anwendung verlustfreier Matrixbildung überwunden, denn dabei schließt die Kodiermatrix sorgfältig plazierte Quantisierer ein, die gewährleisten, daß die Rundungsfehler genau bekannt sind und mittels ähnlicher Quantisierer im Dekodierer aufgehoben werden können. Jede verlustfreie Matrix ist eine Kaskade aus primitiven Matrizes, und jede primitive Matrix modifiziert nur einen Kanal.
  • Huffman-Kodieren ist ein häufig angewandtes Verfahren, um an Datenrate zu sparen, wenn nicht für alte möglichen Werte die gleiche Wahrscheinlichkeit besteht. Bei MLP werden vier verschiedene Huffman-Tabellen angewandt, einschließlich des allgemein bekannten Rice-Code, um verschiedene Signalstatistiken bedienen zu können. Diese Tabellen sind alle dem Signalpegel entsprechend skaliert und lassen sich leicht algorithmisch dekodieren (ohne Verwendung von Tabellen), auch wenn es häufig wirksamer ist, Tabellen in Softwaredekodierern zu verwenden.
  • Da die Länge eines Huffman-kodierten Abtastwertes bis zu seiner Dekodierung nicht bekannt ist, und da die Huffman-kodierten Abtastwerte auf der Basis von Abtastwert zu Abtastwert miteinander verschachtelt sind, muß der Huffman-Dekodierer die Operationen der Auflösung der Verschachtelung und der Dekodierung kombinieren.
  • In den Köpfen der Zugangseinheiten steht Zeitsteuerinformation zur Verfügung, um eine Zeitsteuerung des Datenerfassungsvorgangs von der Platte zu ermöglichen. Im einzelnen ist jeder Zugangseinheit ein Dekodiererzeitstempel (Decoder Time Stamp - DTS) zugeordnet, der die zu wählende Zeit anzeigt, zu der diese Zugangseinheit dem Dekodierer vorgelegt werden soll. Es wird auch ein Präsentationszeitstempel (Presentation Time Stamp - PTS) verwendet, um die gewünschte Zeit anzuzeigen, zu der Präsentationseinheiten am Ausgang des Dekodierers abzuliefern sind. Die Differenz zwischen diesen Zeitpunkten gibt die Verzögerung wieder, die der Dekodieroperation zugeordnet ist.
  • Die mittels MLP kodierten Zugangseinheiten umfassen jeweils in einem Kopf Daten, die die Länge der jeweiligen Zugangseinheit anzeigen. Einige Zugangseinheiten, beispielsweise eine in je 8 Einheiten umfassen längere Köpfe, die auch Steuerdaten enthalten, welche die Spitzendatenrate innerhalb der Spur anzeigen. Diese Spitzendatenrate ist von Anfang an bekannt, da der Kodierer ja so gesteuert werden kann, daß er einen kodierten Datenstrom mit maximaler Spitzendatenrate erzeugt.
  • Diese Spitzendatenrate kann in einigen Fällen 9,6 Mbit/s betragen. Allerdings läßt sich der Kodiervorgang so steuern, daß eine Spitzendatenrate für den Audiostrom sich auf einem anderen Pegel als dem absoluten Maximum von 9,6 Mbit/s befindet. Das kann wünschenswert sein, wenn Video- und Audiodaten auf der Platte gespeichert werden sollen, mit dem Ergebnis, daß die Audiodaten mit der Spitzenrate von 9,6 Mbit/s nicht gelesen werden können. In diesem Fall können die Audiodaten so spezifiziert sein, daß sie zum Beispiel eine Spitzenrate von 6,144 MBit/s haben. Wenn das Kodiersystem imstande sein soll, den kodierten Strom mit der gewünschten Spitzendatenrate zu liefern, muß es eine gewisse Fähigkeit des Vorhersehens während des Kodierprozesses besitzen; das kann etwa eine Sekunde ausmachen.
  • Wie 5 zeigt, weist der MLP-Kodierer einen Kodiererkern 12 und einen FIFO-Puffer 14 auf. Die kodierten Audiodaten werden fertig verpackt zum Schreiben auf Sektoren der Platte und mit kodierte Nichtaudiodaten enthaltenden Sektoren in einem Multiplexer 16 zur Authoring-Abgabe an die DVD 20 kombiniert. Das Kodieren der Nichtaudiodaten ist im vorliegenden Text nicht beschrieben.
  • Der DVD-Leser umfaßt einen Demultiplexer 22, der die Daten von Sektoren der Platte 20 empfängt, und bietet einen Ausgang für Audiodaten und einen weiteren für Nichtaudiodaten. Die Zugangseinheiten haben unterschiedliche Länge, auch wenn sie eine gleichbleibende Menge an Audiodaten wiedergeben (80 Abtastwerte im Fall der 96 kHz-Abtastung). Ausgedrückt in Datenpaketen weisen. also die von einer MLP kodierten Platte gelesenen Daten einen paketierten Strom variabler Rate auf.
  • Die Audiodaten werden einem Versorgungspuffer 24 zugeleitet, der eine Doppelfunktion erfüllt. Erstens überdeckt er Unterbrechungen in der Datenzufuhr vom Demultiplexer, und zweitens speichert er die Daten bis zum richtigen Moment (DTS), zu dem jede Zugangseinheit dem Dekodierer zuzustellen ist. Der Dekodierer weist den FIFO-Puffer 30 und einen Dekodiererkern 32 auf. Die FIFO-Puffer 14, 30 im Kodierer und Dekodierer machen es möglich, die auf der Platte gespeicherte Spitzendatenrate zu verringern.
  • Die Ausgabe des Versorgungspuffers 24 ist ein serialisierter Datenstrom, dessen Rate im allgemeinen 9,6 Mbit/s oder darüber ist. Ist die Rate höher, wird jede Zugangseinheit in einer kürzeren Zeit serialisiert als die Zeit zwischen ihrem DTS und dem DTS der folgenden Zugangseinheit, so daß es Zeitlücken zwischen den serialisierten Zugangseinheiten gibt. Die Spitzendatenrate des Stroms ist dann die kleinstmögliche Rate, mit der Zugangseinheiten serialisiert werden konnten, ohne daß eine oder mehr der Zeitlücken negativ wurden.
  • Die Ausgabe des Versorgungspuffers wird dem Dekodierer 28 zugeleitet, und der Datenstrom wird entsprechend den Dekodiererzeitstempeln zeitlich gesteuert. Ähnlich wird die Ausgabe des MLP-Dekodierers, die die wiederhergestellten Präsentationseinheiten darstellt, entsprechend den Präsentationszeitstempeln zeitlich gesteuert. Der von einer MLP-kodierten DVD gelesene, paketisierte Audiostrom variabler Rate ist unter Umständen nicht zur Übertragung über gewisse Übertragungssysteme geeignet. Zum Beispiel sind einige Schnittstellen, wie die IEC61958 von Natur aus für feste Raten bestimmt. Dann muß eine Auffüllung auf einen Strom fester Rate erfolgen. Wenn die feste Rate der Schnittstelle festverdrahtet ist oder eine obere Grenze hat, kann die Information für die Spitzenrate von den Zugangseinheitsköpfen benutzt werden, um im voraus zu bestimmen, ob die Übertragung der Spur möglich ist.
  • ATM ist paketbasiert; aber es gibt Protokolle, die die Übertragung von "CBR" (Constant Bit Rate) Strömen über ATM stützen. FireWire (IEEE 1394) stützt sowohl "isochrone" Übertragung mit fester Rate als auch variabler Rate (ebenso wie "asynchrone" Übertragung). Beim Übertragen mit einer festen Rate über diese Systeme ist es von Vorteil, die niedrigstmögliche Rate zu wählen (festgelegt durch die Information über die Spitzenrate in den Zugangseinheitsköpfen), um so viel Bandbreite wie möglich zur Benutzung durch andere Geräte frei zu lassen. Tatsächlich wird die Übertragung mit variabler Rate gegenüber FireWire bevorzugt: hier muß zu Beginn der Übertragung ein Kompromiß hinsichtlich der Spitzenbandbreite getroffen werden; und wiederum ist es zur Verringerung der Auswirkung auf andere Dienste von Vorteil, die geringste angemessene Rate anhand der Information über die Spitzenrate in den Zugangseinheitsköpfen festzulegen.
  • Ein Transcoder kann den paketierten Audiostrom variabler Rate in einen paketierten Strom fester Rate umwandeln, der für Schnittstellen geeignet ist, die mit fester Rate funktionieren. Die feste Rate wird anhand der in den Zugangseinheitsköpfen gespeicherten Information festgelegt. Schnittstellen mit fester Rate können zur Kommunikation mit externen Geräten benutzt werden, beispielsweise einem Dekodierer für die Umgebung oder einem digitalen Lautsprecher mit MLP-Eingang oder mit dem internen Dekodierer des DVD-Spielers. Wenn man einen Strom mit fester Rate vorsieht, kann die Dekodierarchitektur vereinfacht werden.
  • Der Transcoder ist mit einem herkömmlichen Dekodierer in dem in 6 gezeigten System verbunden, der zwei mögliche Ausgaben hat, eine erste, herkömmliche, dekodierte Ausgabe, die einen Strom PCM-Audiodaten liefert, oder eine alternative Ausgabe eines paketierten Datenstroms fester Rate, der in der MLP-kodierten Domäne bleibt. Diese Ausgabe wird ohne zwischengeschalteten Dekodier- und Kodierprozeß abgegeben.
  • Der paketierte Datenstrom fester Rate kann mit Auffüllungen an den Enden der Zugangseinheiten variabler Länge bereitgestellt werden, damit eine konstante Datenrate entsteht. Das Ausmaß der erforderlichen Auffüllung hängt vom Zeitintervall zwischen dem Start der Zugangseinheit und der folgenden Zugangseinheit ab. Dieses Zeitintervall ist nicht konstant, denn der Kodierer kann eine Manipulation durchführen. Das wird nachfolgend beschrieben.
  • Es gibt eine maximale Datenrate von 9,6 Mbit/s, mit der Daten auf der DVD gespeichert werden können. Um sicherzustellen, daß es keine Passage in den Daten gibt, die diese Rate übersteigt, können die Grenzen der Zugangseinheit (zeitlich) gestreckt werden, um die Datenrate zu reduzieren. Mit anderen Worten, die Zeitsteuerung der Zugangseinheiten wird geändert, um die Spitzendatenrate zu reduzieren, und die Dekodiererzeitstempel werden entsprechend geändert.
  • Der Kodierer kann also durch Manipulieren der Zugangseinheitskonfigurationen angewiesen werden, seine Kodierung so durchzuführen, daß eine ausgewählte maximale Datenrate nicht überschritten wird, wie oben erwähnt; diese Information über die maximale Datenrate wird in den Zugangseinheitsköpfen gespeichert. In die Köpfe können noch weitere Steuerdaten eingegeben werden, um einem Empfänger innerhalb des Schnittstellensystems mit fester Rate das Ausmaß der durchgeführten Auffüllung anzuzeigen. Dieser Empfänger könnte ein weiterer Transcoder oder ein MLP-Dekodierer sein, der möglicherweise insofern vereinfacht ist, als er nur eine Eingabe mit fester Rate annimmt.
  • Wie schon gesagt, könnte ein solcher Dekodierer in eine Vorrichtung einverleibt sein, die zusätzliche Funktionalität bietet, beispielsweise ein Dekodierer für die Umgebung. Der Transcoder innerhalb des DVD-Spielers ist ein "leichtgewichtiger" Prozeß, der vorzugsweise in das kundenspezifische Silikon eingebettet sein kann, welches zur Wiedergewinnung der Datenbits von der Platte verwendet wird. Der Transcoder kann auch mit der im Spieler vorgesehenen Pufferung eng integriert sein, damit die Daten variabler Rate mit minimalem Speichergebrauch optimal gehandhabt werden können.
  • Der Gebrauch von Schnittstellenprotokollen mit fester Paketrate kann vereinfacht werden. Wie schon gesagt, sind Beispiele möglicher Verwendung eines paketierten Datenstroms fester Rate die Übermittlung über serielle Schnittstellen, wie IEC61958, MADI und NVISION. Im IEEE 1394 FireWire-Protokoll und im ISO_Ethernet protocol ist die Bandbreite verhandelbar und wird vor der Übertragung reserviert. Infolgedessen besteht auch der Wunsch nach einer Verringerung der Bandbreite eines Signals für die Übertragung über eine derartige Schnittstelle. Das läßt sich erreichen, wenn die Spitzendatenrate auf ein minimales Niveau abgesenkt wird.
  • Wenn Daten auf der Platte als Strom fester Rate gespeichert sind, kann es möglich sein, die Daten wieder zu serialisieren, um eine solche Verringerung der Datenrate zu erhalten. Im Zusammenhang mit dieser erneuten Serialisierung müssen die Zugriffeinheitsdaten mit einer niedrigeren Datenrate geschrieben werden; was die Zugangseinheiten verlängert, und das kann bis zu einer Grenze unmittelbar ehe die Zugangseinheiten einander überlappen würden, durchgeführt werden. Anders ausgedrückt heißt das, daß die erneute Serialisierung mit geringer Rate die Lücken zwischen Zugangseinheiten schließt. Deshalb umfassen Zugangseinheitsköpfe gemäß einem weiteren Aspekt der Erfindung einen Hinweis auf die Mindestdatenrate, auf die die Daten wieder serialisiert werden könnten. Das kann wiederum in Form von Steuerdaten geschehen, welche die kodierten Daten begleiten. Damit könnte die niedrigst mögliche Bandbreite für jede Tonspur reserviert werden, so daß soviel Bandbreite wie möglich für sonstigen Verkehr auf der Schnittstelle freigegeben würde.
  • Das Auffüllen mit Daten zur Umwandlung von einer variablen Rate auf eine feste Rate und das erneute Serialisieren zur Umwandlung von einer festen Rate auf eine niedrigere feste Rate sind je für sich verhältnismäßig einfache Prozesse. Der Transcoder für diese Operationen kann deshalb benutzt werden, wenn die Spur mit einer höheren festen Rate oder mit variabler Rate kodiert war. Diese Ausgabe fester Rate, die in 6 mit "MLP Fixed Option" bezeichnet ist, weist natürlich ein gleichbleibendes Bandbreitensignal auf. Damit kann den Audiodaten eine feste Bandbreite auf der Basis von Spur zu Spur für die Übertragung über die FireWire-Schnittstelle zugeordnet werden. Die Minimierung der Datenrate über FireWire hat den Vorteil, daß soviel Bandbreite wie möglich für andere isochrone Übertragungen verfügbar bleibt, die auch reservierte Bandbreite brauchen.
  • Wie schon gesagt, können durch Neupaketierung größere Minderungen der Datenrate erzielt werden. Dazu muß der vom Kodierer durchgeführte Paketierprozeß neu vorgenommen werden, was nachfolgend kurz beschrieben werden soll.
  • Die von den FIFO-Puffern im Kodierer und Dekodierer vorgenommene Pufferoperation kann auf verschiedene Weise gesteuert werden, je nach den gewünschten Systemmerkmalen. Wie unter Hinweis auf 5 erklärt, trägt für ein Echtzeitübertragungssystem die Menge in den beiden Puffern gespeicherter Daten kombiniert zur Gesamtverzögerung der Kodier- und Dekodieroperation bei. Die Gesamtverzögerung sollte konstant und so klein wie möglich sein.
  • Es ist wichtig, sicherzustellen, daß der Dekodierer immer Daten zum Dekodieren zur Verfügung hat, um jegliche Unterbrechung im Datentransfer zu vermeiden. Eine für die Übertragung von Daten in Echtzeit, beispielsweise über eine Funkverbindung geeignete Strategie besteht darin, eine feste FIFO-Gesamtverzögerung vorzusehen und in jedem Moment so viele Daten wie möglich vom Kodierer zum Dekodierer zu senden. Hierdurch wird die Datenmenge im Dekodiererpuffer während der Übertragung maximiert.
  • Wenn die kodierten Daten auf einer DVD mittels eines Authoring-Systems für Platten gespeichert werden sollen, gibt es die Einschränkungen hinsichtlich der Echtzeit nicht mehr, und deshalb können die Daten für eine volle Spur analysiert werden, ehe der Authoring-Vorgang durchgeführt wird. Das ermöglicht es, die Datenpegel in den Puffern auf eine andere Weise zu steuern, um die Daten zu berücksichtigen, die in zukünftigen Zeiten während der Spur kodiert werden sollen.
  • Der Puffer kann beim Kodieren so genutzt werden, da es während des Dekodierens eine minimale Verzögerung gibt, indem dafür gesorgt wird, daß der Dekodiererpuffer soviel wie möglich leer ist. Der Dekodiererpuffer wird mit Daten gefüllt, wenn sich eine Tonpassage mit hoher Datenrate (z.B. von hoher Höhenenergie) nähert. Die Größe des Dekodiererpuffers muß bei der Kodiereroperation berücksichtigt werden.
  • Das Ausmaß, um das der Puffer des Dekodierers vor einer Passage mit hoher Rate gefüllt werden muß, hängt von der erlaubten Spitzendatenrate ab. Wenn das Authoring-System auf einen Strom variabler Rate auf der Platte abgestellt ist und sonst weiter nichts berücksichtigt werden muß, kann diese Spitzendatenrate den maximalen Wert von 9,6 Mbit/s bekommen, um die Dekodierverzögerung auf ein Minimum einzuschränken. Wenn aber längsseits weitere Dienste, beispielsweise Kinofilm gespeichert werden müssen, kann eine niedrigere Spitzendatenrate wünschenswert sein. Ist das Authoring-System auf einen Strom fester Rate auf der Platte abgestellt, dann ist es im allgemeinen erwünscht, die niedrigstmögliche Datenrate zu benutzen, um die Abspielzeit zu maximieren.
  • Ein weiterer Aspekt der Erfindung bietet ein alternatives Kodierverfahren, bei dem ein Hinweis auf die Mindestdatenrate vorgesehen ist, auf die der Abtastwert neu paketiert werden kann. Diese Information wird vom Mastering-System zusammen mit dem Strom bereitgestellt. Das Neupaketieren beinhaltet das Justieren der Startzeiten (DTS), um die Lücken zwischen einigen der Pakete zu vergrößern, damit, vorbehaltlich der Einschränkung durch eine angenommene Puffergröße im Dekodierer, noch niedrigere Datenraten erzielt werden können.
  • Bei gegebener FIFO-Puffergröße im Dekodierer ist es nach dem Empfang des vollen Datenstroms möglich, die Mindestdatenrate festzulegen, mit der der Datenstrom paketiert werden kann. Das bedeutet im wesentlichen, daß die Zeitgrenzen zwischen Zugangseinheiten für eine angenommene Datenrate manipuliert werden müssen. Die Länge der Zugangseinheiten wird durch die Serialisierung der Zugangseinheiten mit der angenommenen Datenrate bestimmt. Die Einschränkung hinsichtlich des Ausmaßes, bis zu dem die Zeitpunkte zwischen Zugangseinheiten manipuliert werden können, liegt in der Größe des Dekodiererpuffers, da dieser niemals überfüllt werden darf. Das ist ein etwas schwierigerer Prozeß als die erneute Serialisierung oder Auffüllung.
  • Die angenommene Datenrate wird iterativ reduziert, bis ein Minimum gefunden wird, bei dem der Datenstrom übertragbar ist. Die mathematische Modellierung wird also iterativ durchgeführt. Das verbraucht vernachlässigbare Rechnerzeit, wenn es mittels der Halbierungsmethode oder einem der sonstigen wirksamen Verfahren eindimensionaler inverser Interpolation durchgeführt wird. Die für die Durchführung dieser Modellierung erforderlichen Daten weisen eine Anmerkung der Länge (in Bit) falls (if) jeder Zugangseinheit auf. Es ist dafür viel weniger Speicherraum nötig als für das kodierte Signal selbst, und die Ausgabe kann leicht vom Kodierer zusammen mit dem kodierten Strom erfolgen.
  • Die Daten für die Authoring-Abgabe an die Platte oder zur Bereitstellung an eine Schnittstelle werden letztendlich einer Transkodieroperation unterzogen, um einen paketierten Strom minimaler Rate unter Berücksichtigung des Dekodierer-FIFO zu erzeugen. Das kann dann ein paketierter Strom fester Rate oder ein Strom variabler Rate mit gekappter maximaler Datenrate sein.
  • Wie 7 zeigt, ist am Schreiben von Daten auf eine DVD eine Mastering-Stufe 40 und eine Authoring-Stufe 42 beteiligt. Die Mastering-Stufe 40 kann auf herkömmliche Weise so gesteuert werden, daß sie einen PCM-Strom, mit "PCM" bezeichnet, hervorbringt, der anschließend mittels MLP kodiert und unter Verwendung eines Authoring-Systems auf der DVD vorgesehen wird. Diese Folge ist in 7 dargestellt.
  • Gemäß diesem Aspekt der Erfindung besitzt die Mastering-Stufe 40 auch die Fähigkeit zur MLP-Kodierung. Aus diesem Grund verläßt sich die Eingabe von Daten auf die DVD-Platte (oder ein sonstiges Speichermedium) auf die eine oder andere der beiden Stufen für das MLP-Kodieren. Die Mastering-Stufe bietet also einen paketierten, MLP-kodierten Strom fester Rate, der in 7 mit "MLP Fixed" bezeichnet ist, der dann mittels Authoring-Abgabe auf eine DVD oder CD-ROM oder ein sonstiges Speichermedium gegeben werden kann. Die Übertragung des "MLP Fixed" Datenstroms mittels eines Authoring-Systems auf die Platte ist in 7 nicht dargestellt. Dieser "MLP Fixed" Strom umfaßt einen Hinweis auf die Mindestdatenrate, zu der der Strom neu paketiert werden könnte, wie während des MLP-Kodierens (oder danach) bestimmt.
  • Die feste Rate der "MLP-Fixed" Ausgabe braucht auf dieser Stufe nicht der festen Mindestdatenrate zu entsprechen, mit der die DVD das Authoring erfahren kann, denn die anschließende (nicht gezeigte) Authoring-Stufe kann ein weiteres Transkodieren auf die gewünschte Mindestrate durchführen. Für ein Mastering auf eine höhere Rate kann es gute Gründe geben: einer ist der, die Möglichkeit zu vermeiden, daß ein unerwartet lautes Signal die zulässige Rate übersteigt; ein weiterer ist der, daß ein MLP-Strom fester Rate mit Studiostandardgerät aufgezeichnet werden soll, welches für normale PCM-Audiodaten bestimmt ist, und man dann unter einer kleinen Anzahl von Standarddatenraten zu wählen haben mag.
  • Die kleinste feste Rate hängt von der Größe des FIFO-Puffers 30 im Dekodierer ab, und die angezeigte Mindestrate geht von einer gegebenen FIFO-Puffergröße aus. Der Kodierer kann die Rate für jede von mehreren verschiedenen Annahmen über die Dekodierspezifikation notieren (um bei einer möglichen anschließenden Transkodierung zu helfen, beispielsweise einer Neupaketierung im Abspielgerät auf die niedrigstmögliche Spitzenrate zur Übertragung über FireWire, wie oben erläutert). So könnte z.B. ein Dekodierer am Empfangsende eines FireWire-Bus einen viel größeren FIFO haben als die für einen DVD-Spieler spezifizierten 90 Kilobyte.
  • Diese Information über die Mindestrate ist am Anfang der Ausgabedatei gespeichert, so daß das Authoring die gewünschte Rate für die Übertragung bestimmen kann. Damit erübrigt sich die Notwendigkeit, daß die Authoring-Stufe einen Prescan durchführen muß, um die Mindestrate zur anschließenden Übertragung festzustellen. Die Mindestrate, bei der eine Paketierung fester Rate möglich ist, kann auch als eine obere Grenze der Datenrate eines Stroms variabler Rate benutzt werden, der vom Strom fester Rate abgeleitet wird. Eine Neupaketierung zum Erhalten eines Datenstroms mit der Mindestdatenrate kann von einem DVD-Spieler durchgeführt werden, um eine Ausgabe der kleinstmöglichen Bandbreite zur Übertragung über einen Datenbus zu erhalten, beispielsweise ein FireWire-Netz, welches mehrere Dienste im ganzen Haus herumträgt.
  • Die Mastering-Stufe kann auch die Gesamtmenge an Daten für die Spur, abgesehen von denen zum Auffüllen, notieren. Das ist das gleiche wie die Gesamtmenge an Daten in einem Strom variabler Rate, der vom Strom fester Rate abgeleitet ist, und kann von einem Mastering-System benutzt werden, um die verfügbare Abspielzeit einer aus mehreren Spuren zusammengesetzten Platte zu schätzen.
  • Paketierte Audiodaten fester Rate können sogar auf einem Speichermedium, wie DVD, erwünscht sein, mit dem eine Übertragung in variabler Rate abgewickelt werden kann, wenn die Audiodaten auf dem Speichermedium Videodaten variabler Rate begleiten sollen, beispielsweise für digitale Kinodaten. Die Audiodaten fester Rate auf der Platte erleichtern dann die Zeitsteueroperationen für die Dekodierschaltkreisanordnung. Ströme fester Raten sind auch wünschenswert zum Speichern auf anderen Trägern, beispielsweise CD oder Magnetband.
  • Für Tonstudioausrüstung werden auch häufig paketierte Datenströme fester Rate benötigt, und ein Authoring derartiger Datenströme unmittelbar auf das Speichermedium erleichtert dies. Die Erfindung ist auch auf das CD-Format anwendbar. Abwandlungen und Veränderungen liegen für den Fachmann auf der Hand.

Claims (8)

  1. Kodierer (12) zum Erzeugen eines kodierten, paketierten Stroms, mit einer Einrichtung, die die Mindestdatenrate ermittelt, auf die der Strom zur erfolgreichen Dekodierung mittels eines Dekodierers (32), der eine gegebene FIFO-Puffergröße (30) hat, neupaketiert werden könnte, und einer Einrichtung, die in den Strom Steuerdaten einführt, welche diese Mindestdatenrate wiedergeben.
  2. Kodierer nach Anspruch 1, bei dem der kodierte Strom verlustfrei komprimierte, digitale Audiodaten sind.
  3. Mastering-System (40) mit einem Kodierer (12) nach Anspruch 1.
  4. System mit einem Mastering-System (40) nach Anspruch 3, und einer Einrichtung zum Neupaketieren der Daten zur Schaffung eines Stroms, der eine in Abhängigkeit von den Steuerdaten berechnete Spitzendatenrate hat.
  5. System nach Anspruch 4, bei dem der Strom, der eine den Steuerdaten entsprechende Spitzendatenrate hat, einen Strom fester Datenrate umfaßt.
  6. System zur Schaffung kodierter Daten auf einer DVD, einschließlich eines Mastering-Systems (40) nach Anspruch 3 und einer Einrichtung zum Schreiben der Steuerdaten auf die platte mit den kodierten Daten.
  7. System zur Schaffung kodierter Daten auf einer DVD, einschließlich eines Mastering-Systems (40) und eines Authoring-Systems (42), wobei das Authoring-System einen Kodierer (12) nach Anspruch 1 umfaßt.
  8. System nach einem der Ansprüche 4 bis 7, bei dem der Kodierer (12) einen MLP verlustfreien Kodierer für Audiodaten umfaßt.
DE69921326T 1998-07-03 1999-07-05 TRANSKODIERER FÜR DATENSTRöME MIT FESTEN UND VERÄNDERLICHEN DATENRATEN Expired - Lifetime DE69921326T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB9814513 1998-07-03
GBGB9814513.9A GB9814513D0 (en) 1998-07-03 1998-07-03 Trancoders for fixed and variable rate datastreams
GB9907918 1999-04-07
GBGB9907918.8A GB9907918D0 (en) 1999-04-07 1999-04-07 Lossless packing
PCT/GB1999/002138 WO2000002357A1 (en) 1998-07-03 1999-07-05 Transcoders for fixed and variable rate data streams

Publications (2)

Publication Number Publication Date
DE69921326D1 DE69921326D1 (de) 2004-11-25
DE69921326T2 true DE69921326T2 (de) 2006-02-09

Family

ID=26313972

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69921326T Expired - Lifetime DE69921326T2 (de) 1998-07-03 1999-07-05 TRANSKODIERER FÜR DATENSTRöME MIT FESTEN UND VERÄNDERLICHEN DATENRATEN

Country Status (10)

Country Link
EP (1) EP1095488B8 (de)
JP (1) JP2002520760A (de)
KR (1) KR100725766B1 (de)
CN (1) CN1331335C (de)
AT (1) ATE280460T1 (de)
AU (1) AU759989B2 (de)
CA (1) CA2336411C (de)
DE (1) DE69921326T2 (de)
ES (1) ES2228061T3 (de)
WO (1) WO2000002357A1 (de)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3582444B2 (ja) * 2000-01-28 2004-10-27 ヤマハ株式会社 音楽情報データ通信方法、音楽情報データ送信装置、音楽情報データ受信装置および記憶媒体
JP4529226B2 (ja) * 2000-04-20 2010-08-25 ヤマハ株式会社 データ記録方法および記録媒体
US7206272B2 (en) * 2000-04-20 2007-04-17 Yamaha Corporation Method for recording asynchronously produced digital data codes, recording unit used for the method, method for reproducing the digital data codes, playback unit used for the method and information storage medium
KR100720987B1 (ko) * 2000-08-03 2007-05-23 톰슨 라이센싱 낮은 비트율로 데이터스트림을 레코딩하기 위한 방법
CN100364234C (zh) * 2001-11-29 2008-01-23 联发科技股份有限公司 声讯的播放系统与无失真压缩编码系统
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7023880B2 (en) * 2002-10-28 2006-04-04 Qualcomm Incorporated Re-formatting variable-rate vocoder frames for inter-system transmissions
US7169996B2 (en) * 2002-11-12 2007-01-30 Medialab Solutions Llc Systems and methods for generating music using data/music data file transmitted/received via a network
JP2004303353A (ja) * 2003-03-31 2004-10-28 Toshiba Corp 情報記録媒体及び情報処理方法、情報処理装置及び再生装置
JP2005051633A (ja) * 2003-07-30 2005-02-24 Sony Corp 編集装置、ビットレート制御方法及びビットレート制御プログラム
CN1989563B (zh) 2005-02-01 2011-06-22 松下电器产业株式会社 再现装置、程序和再现方法
US7706905B2 (en) * 2005-07-29 2010-04-27 Lg Electronics Inc. Method for processing audio signal
KR20080049735A (ko) * 2005-08-30 2008-06-04 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7716043B2 (en) 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
US9794712B2 (en) 2014-04-25 2017-10-17 Dolby Laboratories Licensing Corporation Matrix decomposition for rendering adaptive audio using high definition audio codecs

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5623424A (en) * 1995-05-08 1997-04-22 Kabushiki Kaisha Toshiba Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels
US5684714A (en) * 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
US5963256A (en) * 1996-01-11 1999-10-05 Sony Corporation Coding according to degree of coding difficulty in conformity with a target bit rate

Also Published As

Publication number Publication date
AU4635599A (en) 2000-01-24
ATE280460T1 (de) 2004-11-15
CA2336411A1 (en) 2000-01-13
DE69921326D1 (de) 2004-11-25
CA2336411C (en) 2007-11-13
KR20010071723A (ko) 2001-07-31
AU759989B2 (en) 2003-05-01
JP2002520760A (ja) 2002-07-09
KR100725766B1 (ko) 2007-06-08
WO2000002357A1 (en) 2000-01-13
CN1331335C (zh) 2007-08-08
ES2228061T3 (es) 2005-04-01
CN1308804A (zh) 2001-08-15
EP1095488A1 (de) 2001-05-02
EP1095488B8 (de) 2005-02-02
EP1095488B1 (de) 2004-10-20

Similar Documents

Publication Publication Date Title
DE69921326T2 (de) TRANSKODIERER FÜR DATENSTRöME MIT FESTEN UND VERÄNDERLICHEN DATENRATEN
DE69823168T2 (de) Verfahren und gerät zur kodierung und formatierung von daten eines videoprogramms zur erzeugung sich mehrfach überlappender darstellungen des videoprogramms
DE69637410T2 (de) Video-auf-anfragesystem mit verzögerung und fernsehverfahren dazu
DE69034132T2 (de) Digitale Signalübertragung durch einen Aufzeichnungträger
DE69732874T2 (de) Kodierung, Speicherung und Übertragung von digitalen Signalen
EP1647010B1 (de) Audiodateiformatumwandlung
DE69834045T2 (de) Verfahren zur einkapselung von daten in transportpakete konstanter länge
EP0727126B1 (de) Umwandlungssystem für ein mpeg-informationssignal
DE69534267T2 (de) Aufnahme und Wiedergabe eines MPEG-Informationssignals auf/von einem Aufnahmeträger
DE102005004941B4 (de) Konvertierung von Daten, insbesondere zur Wiedergabe von Audio- und/oder Videoinformationen
DE69533241T2 (de) Videosignalaufnahme- und -Wiedergabeanlage
DE60210611T2 (de) Effizientes übertragen und abspielen digitaler information
CH691013A5 (de) Verfahren und Vorrichtung zur multiplexierten Kodierung digitaler Audioinformation auf ein digitales Audiospeichermedium.
DE69832454T2 (de) Datenübertragungssystem, sender und empfänger
DE4321488C2 (de) Digitales magnetisches Aufzeichnungsverfahren und Aufzeichnungsgerät
DE602004009560T2 (de) Datenübertragungssynchronisationsschema
DE2901034A1 (de) Verfahren und schaltungsanordnung zur komprimierung und dekomprimierung von analogsignalen in digitaler form
DE69633808T2 (de) Interaktives Video-auf-Abrufsystem mit Paketübertragung über eine ATM-Fernmeldeleitung
DE69733199T2 (de) Verfahren und audio-server-system für ein unzuverlässiges netzwerk
DE69829272T2 (de) Anordnung mit einfügungsmittel zur identifizierung mittels zusatzinformation eines informationspaketstroms, der kodierte digitale daten überträgt
DE102012215362A1 (de) Datenverarbeitungsvorrichtung, verfahren und steuerprogramm
EP0262362A2 (de) Verfahren zur Aufzeichnung und Wiedergabe des in einem Fernsehsignal übertragenen Datenpakets
DE2945615A1 (de) Digitales bildverarbeitungssystem fuer bewegte szenen
DE3304796C2 (de)
DE69432631T2 (de) Multiplexieren in einem System zur Kompression und Expandierung von Daten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: DOLBY LABORATORIES LICENSING CORP., SAN FRANCISCO,