-
Hintergrund
der Erfindung
-
Diese
Erfindung betrifft das Aufzeichnen und Wiedergeben von digitalem
Mehrkanal-Audio mit unterschiedlichen Auflösungen für unterschiedliche Kanäle und bezieht
sich allgemein auf ein Speichermedium wie die digitale, vielseitige
Disc (DVD: Digital Versatile Disc). Insbesondere betrifft die Erfindung ein
solches Speichermedium, welches hauptsächlich Audioinformation enthält.
-
DVDs
sind zweiseitige Aufzeichnungsmedien für digitale Breitbandinformation
mit der ungefähren
Größe von herkömmlichen
Kompaktdiscs („CDs"). DVDs sind zur
Speicherung von ungefähr 4,7
Gigabyte-Daten pro Seite fähig.
Ihre große
Speicherkapzität
und geringe Größe machen
DVDs für das
Ersetzen von Videobandkassetten bei der Verwendung für private
Videosysteme attraktiv.
-
DVDs
unterstützen
den Videostandard MPEG-2 (MPEG: Moving Picture Experts Group). DVDs
sind auch fähig
für den
Umgang mit dem AC-3 Mehrkanalaudioformat von Dolby oder alternativ
einem Zweikanalformat, das mit einer unkomprimierten Pulscodemodulation
(„PCM") kodiert ist.
-
Da
jedoch herkömmliche
DVDs primär
darauf gerichtet sind, das Speichern und das Anzeigen von Videoinhalten
zu unterstützen,
sind herkömmliche
DVDs insbesondere nicht gut geeignet zum Unterstützen von Inhalten, die primär Audio
sind, insbesondere verbessertes Audio wie Sechskanalaudio, welches
das Abtasten mit Raten umfasst, die höher als solche liegen, welche
herkömmlicherweise
verwendet werden.
-
Der
Artikel mit dem Titel „Compact
Disc mit gemultiplexten Informationskanälen" aus NEUES AUS DER TECHNIK, Nr. 1, 20.
Februar 1989, Seiten 1–2,
XP002075505, Würzburg,
Deutschland beschreibt das Multiplexen einer Anzahl von Kanälen mit
unterschiedlichen Bandbreiten. Abhängig von der Bandbreite eines
jeden Kanals wird die Abtastrate variiert. Der Zweck des Multiplexens
der Kanäle
besteht in der Verlängerung
der Abspielzeit bei Anwendungen wie Hörbüchern, bei welchen eine geringere Aufzeichnungsaudioqualität akzeptabel
ist.
-
Somit
besteht die Aufgabe der Erfindung darin, Verfahren und eine Vorrichtung
zum Aufzeichnen bereitzustellen, welche DVD-Technologie verwenden, jedoch besser
an den Umgang mit Inhalten angepasst sind, welche primär Audioinhalte
sind.
-
Zusammenfassung
der Erfindung
-
Diese
und andere Vorteile der vorliegenden Erfindung werden gemäß den Prinzipien
der Erfindung durch die Bereitstellung von Verfahren und einer Vorrichtung
zum Aufzeichnen auf einem DVD-artigen
Speichermedium erreicht.
-
Gemäß einem
Aspekt der vorliegenden Erfindung ist ein Verfahren zum Bereitstellen
von digitalen Mehrkanal-Audiosignalabtastungen auf einem Softwareträger vorgesehen,
umfassend:
- – Abtasten einer Mehrzahl von
Audiodatenkanälen
unter Verwendung einer Mehrzahl von Abtastraten, wobei die Mehrzahl
von Abtastraten eine höchste
Abtastrate und eine niedrigste Abtastrate einschließt;
- – gekennzeichnet
durch selektives Codieren von wenigstens zwei aus der Mehrzahl von
Audiodatenkanälen
mit unterschiedlichen Auflösungen; und
durch Anordnen der Abtastungen der Mehrzahl von Audiodatenkanälen in einer
während
der Wiedergabe benötigten
Reihenfolge in einem einzelnen Datenstrom auf einer Spur des Softwareträgers (20),
wobei das Anordnen das Zusammensetzen der Abtastungen in Rahmen
einschließt,
wobei jeder Rahmen ein Intervall zwischen zwei aufeinander folgenden
Abtastungen festlegt, welche bei der niedrigsten Abtastrate abgetastet
wurden, und wobei nicht aufeinander folgende Abtastungen, welche
bei im wesentlichen der gleichen Abtastrate innerhalb irgendeinem Rahmen
abgetastet wurden, nicht durch eine Abtastung getrennt sind, welche
nicht mit der gleichen Abtastrate abgetastet wurde.
-
Gemäß einem
weiteren Aspekt der vorliegenden Erfindung wird eine Vorrichtung
zur Wiedergabe von gespeicherten digitalen Mehrkanal-Audiodatenabtastungen
bereitgestellt, umfassend:
- – einen Demultiplexer zum Lesen
von Abtastungen einer Mehrzahl von Audiodatenkanälen, die in einem einzelnen
Datenstrom auf einen Softwareträger
(20) bereitgestellt sind unter Verwendung des Verfahrens
nach Anspruch 1, wobei wenigstens zwei Kanäle aus der Mehrzahl von Kanälen selektiv
mit unterschiedlichen Auflösungen
codiert sind; und
- – eine
Umwandlungseinheit, wobei die Umwandlungseinheit umfasst:
- – eine
Mehrzahl von Digital-zu-Analog-Wandlern, von denen jeder angeordnet
ist um die Abtastungen eines Kanals aus der Mehrzahl von Kanälen zu empfangen
und die Abtastungen von einer digitalen Form in eine analoge Form
umzuwandeln;
- – eine
Mehrzahl von digitalen Multiplizierern, die mit ausgewählten Ausgangsanschlüssen des
Demultiplexers verbunden sind zum Multiplizieren von aufeinander
folgenden Abtastungen mit verschiedenen, geeigneten digitalen Wichtungsfaktoren;
und
- – eine
Mehrzahl von digitalen Addieren zum selektiven Verknüpfen der
Ausgänge
der Mehrzahl von digitalen Multiplizierern, wobei die Ausgänge der
Mehrzahl der digitalen Addierern mit ausgewählten Eingängen der Mehrzahl der Digital-zu-Analog-Wandlern
gekoppelt sind zum Ableiten von Zweikanal-Stereo aus der Mehrzahl
von Audiodatenkanälen.
-
Die
vorliegende Erfindung kann somit die Speicherung von Audioinhalten
in einem Breitband-Multikanalformat (z. B. 6-Kanal) bereitstellen. Ein
Beispiel eines solchen Breitbandmultikanalsystems ist ein Sechskanalsystem,
bei welchem die sechs Kanäle
durch nicht komprimierte Daten (z. B. PCM-Daten) dargestellt sind.
Jeder Kanal kann mit einer unterschiedlichen Rate codiert sein.
Beispielsweise können
die Front und der Centerkanal unter Verwendung von 96 KHz codiert
sein, die hinteren Kanäle
können
eine 48 KHz Codierung, und der Subwooferkanal eine 12 KHz Codierung
verwenden. Jeder Kanal kann eine unterschiedliche Datentiefe verwenden.
Beispielsweise können
die Front und der Centerkanal unter Verwendung von 20-Bit Wörtern codiert
sein und die hinteren Kanäle
können
unter Verwendung von 16-Bit Wörtern
codiert sein.
-
Falls
gewünscht,
kann ein Zweikanalaudioausgang aus dem Sechskanalaudiodatenstrom
während
der Wiedergabe abgeleitet werden. Um eine genaue Ableitung zu erleichtern,
können
die bei der Erzeugung der Ableitung zu verwendenden Mischungskoeffizienten
mit den Sechskanalaudiodaten geliefert werden.
-
Alternativ
können
Sechskanalaudiospuren durch Zweikanalaudiospuren begleitet werden,
welche im wesentlichen den gleichen Inhalt wie die Sechskanalaudiospuren
besitzen. Das Speichermedium der vorliegenden Erfindung erlaubt
diese zusätzliche
im Mehrformat gespeicherte Zweikanalaudiospur, sodass Erzeuger von
Audioinhalten und Disc-Hersteller mehrere Zweikanalcodieroptionen besitzen.
-
Weitere
Merkmale der Erfindung und verschiedene Vorteile werden durch die
folgende ausführlichere
Beschreibung ersichtlich.
-
Kurze Beschreibung
der Zeichnungen
-
1 ist
eine Darstellung von verschiedenen Datenkanälen und zugeordneten Auflösungen;
-
2 ist
eine vereinfachte Aufsicht auf einen bevorzugten Softwareträger;
-
3 ist
eine Darstellung, welche eine bevorzugte Reihenfolge von aufgezeichneten
Abtastungen auf einem Sechskanal-Aufzeichnungsmedium eines DVD-Typs
zeigt;
-
4 ist
ein vereinfachtes schematisches Blockdiagramm einer veranschaulichenden
Wiedergabe-Schaltungsanordnung;
-
5 ist
ein vereinfachtes schematisches Blockschaltdiagramm einer anderen
veranschaulichenden Wiedergabe-Schaltungsanordnung;
und
-
6 ist
ein Flussdiagramm eines bevorzugten Verfahrens zum Aufzeichnen und
Wiedergeben.
-
Beschreibung
der bevorzugten Ausführungsform
-
Der
Inhalt des Aufzeichnungsmediums vom DVD-Typ der vorliegenden Erfindung
ist primär
Audio. Da ein vorgegebenes Audiosegment bedeutend weniger realen
Platz auf der Disc als ein Videosegment der gleichen Länge verbraucht,
erlaubt die Beschränkung
des größten Disc-Inhaltes
auf Audio, dass ein größerer Teil
der Disc-Kapazität
für Audioreproduktion
zugeordnet ist. Als Folge können
sechs Kanäle
vom hochqualitativen Audio (z. B. in einem linearen PCM oder ΔΣ Modulationsformat
codiert) verwendet werden. Die sechs typischerweise codierten Kanäle sind:
links vorne, Center vorne, rechts vorne, links hinten, Subwoofer
und rechts hinten.
-
Audiokanäle können unter
Verwendung unterschiedlicher Auflösungen codiert werden. Da die Frontkanäle im allgemeinen
die wichtigsten Kanäle sind,
können
die Frontkanäle
mit der höchsten
Auflösung
codiert werden. Die hinteren Kanäle,
welche weniger wichtig als die Frontkanäle sind, können mit einer geringeren Auflösung codiert
werden. Der Subwooferkanal weist im allgemeinen die geringsten Auflösungsanforderungen
auf und kann mit einer geringeren Auflösung codiert werden als die
hinteren Kanäle.
Zusätzlich
zu den gerade beschriebenen Sechskanalaudiokanälen kann ein Softwareträger andere
Kanäle
für das
gleiche Audioprogramm in anderen Formaten aufweisen. Beispielsweise
kann der Softwareträger
auch zwei andere Kanäle
für eine
stereophone Zweikanal-Version (links und rechts) des Audioprogramms
aufweisen. Die für
diese beiden Kanäle
verwendete Auflösung
wird typischerweise die gleiche sein, kann sich jedoch von der Auflösung, welche
für irgendeine
der Sechskanalaudiokanäle verwendet
wird unterscheiden (oder kann die gleiche wie die Auflösung sein,
welche für
eine oder mehrere der Sechskanalaudiokanäle verwendet sind).
-
Im
Falle eines Softwareträgers
mit Sechskanalaudio, welches durch Zweikanalaudio begleitet wird,
können
die Sechskanalaudiodaten in einem einzelnen Datenstrom auf einer
ersten Spur gespeichert sein, während
die Zweikanalaudiodaten in einem einzelnen Strom auf einer zweiten
Spur gespeichert sind. In einer anderen Ausführungsform sind die zwei unterschiedlichen
Formate in einer einzelnen Spur verschachtelt.
-
Wie
in 1 gezeigt, werden N Audiodatenkanäle (beispielswei se
durch die Zahlen 12, 14, 16 und 18 dargestellt)
auf einem Softwareträger 10 (wie einer
DVD Disc 20 in 2) bereitgestellt. N kann einen
oder mehrere Kanäle
umfassen. Wenn beispielsweise N = 8 können sowohl sechs Kanäle für Sechskanalaudio
als auch zwei Kanäle
für Zweikanalaudio umfasst
sein. Natürlich
gibt es viele mögliche
Kanalformate zum Bereitstellen von Audioprogrammen auf dem Softwareträger. Es
können
jede von K unterschiedlichen Auflösungen für die Daten in den verschiedenen
Kanälen
verwendet werden, wobei K kleiner oder gleich N ist. Jeder der N
Kanäle
kann seine eigene Auflösung
(in welchem Fall K = N ist) besitzen oder mehrere Kanäle können die
gleiche Auflösung
teilen (in welchem Fall K < N
ist).
-
Wie
in 1 gezeigt, entsprechen unterschiedliche Auflösungen unterschiedliche
Abtastraten und/oder unterschiedliche Abtastwortlängen (d. h.
eine größere Auflösung bedeutet
eine größere Abtastfrequenz
und/oder eine größere Abtastwortlänge). Momentan
werden in der Aufzeichnungsindustrie zwei Familien von Abtastraten
herkömmlicherweise
verwendet. Die erste Familie umfasst Raten von 48, 96 und 192 KHz.
Die zweite Familie umfasst Raten von 44,1, 88,2 und 176,4 KHz. Gegenwärtig werden
die höchsten
Raten in jeder Familie (192 KHz und 176,4 KHz) nur bei Stereo unterstützt, nicht
jedoch in einem anderen Mehrkanalformat. Beide Familien können mit
Bittiefen von 16,20 und 24 Bit verwendet werden.
-
Wie
in 2 gezeigt, können
die Kanäle
1–N in
mehreren Spuren auf einem Softwareträger wie einer DVD-Disc 20 bereitgestellt
werden. Beispielsweise ist die Spur 1 (welche die Kanäle 1–I umfassen kann
(beispielsweise sechs Kanäle
für Sechskanalaudio))
mit 22 bezeichnet und die Spur M (welche die Kanäle J–N umfassen
kann (z. B. zwei Kanäle
für Zweikanalaudio))
ist mit 24 bezeichnet. Mehrere Kanäle werden typischerweise in
einem einzelnen Datenstrom auf jeder Spur bereitgestellt, sodass
M kleiner als N ist. Beispielsweise umfasst Spur 1 die Kanäle 1 bis
6 und Spur 2 umfasst die Kanäle
7 und 8, wenn N = 8 und I = 6 ist.
-
Audiokanäle können unter
Verwendung einer Anzahl von unterschiedlichen Techniken codiert werden.
Beispielsweise können
die Audiokanäle
mit unterschiedlichen Raten codiert werden. Als Veranschaulichung
hierfür
im Falle von Sechskanalaudio können
die Frontkanäle
mit 96 KHz codiert, die hinteren Kanäle mit 48 KHz und der Subwooferkanal
mit 12 KHz codiert werden. Alternativ können die Frontkanäle bei 88,2
KHz, die hinteren Kanäle
bei 44,1 KHz und der Subwooferkanal bei 11,025 KHz codiert werden.
Diese Kombinationen von Codierraten sind rein veranschaulichend
und jede andere geeignete Kombination von Codierraten kann, falls
gewünscht, stattdessen
verwendet werden.
-
In
geeigneten Codierratenkonfigurationen ist die für den linken vorderen Kanal
verwendete Codierrate vorzugsweise die gleiche wie die für den rechten vorderen
Kanal verwendete. Ähnlich
ist die für
den linken hinteren Kanal verwendete Codierrate vorzugsweise die
gleiche wie die für
den rechten hinteren Kanal verwendete. Das Übereinstimmen der rechten und
linken Seite stellt auf diese Weise sicher, dass die Audiowiedergabe
von der Disc symmetrisch ist.
-
Andere Überlegungen
betreffen das Verhältnis
zwischen den verschiedenen Codierraten. Wie in den obigen veranschaulichenden
Beispielen gezeigt, werden Kanäle
vorzugsweise bei Raten codiert, welche ganzzahlige Vielfache der
für andere
Kanäle
verwendeten Codierraten sind. Beispielsweise ist die zum Codieren
der vorderen Kanäle
in dem ersten obigen veranschaulichenden Beispiel verwendete Codierrate
von 96 KHz das zweifache (2 ×)
der Codierrate von 48 KHz, welche verwendet wird um die hinteren
Kanäle
zu codieren und ist das achtfache (8 ×) der Codierrate von 12 KHz,
welche verwendet wird um den Subwooferkanal zu codieren. Ähnlich ist
die zum Codieren der vorderen Kanäle verwendete Codierrate von
88,2 KHz in dem zweiten veranschaulichenden obigen Beispiel das
zweifache (2 ×)
der Codierrate von 44,1 KHz, welche verwendet wird um die hinteren
Kanäle
zu codieren und ist das achtfache (8 ×) der Codierrate von 11,025
KHz, die verwendet wird um den Subwooferkanal zu codieren.
-
Zusätzlich zu
dem Verändern
der Codierrate kann die Auflösung.
der Audiokanäle
durch das Verwenden von Datenwörtern
unterschiedlicher Größe für unterschiedliche
Kanäle
verändert
werden (siehe wiederum 1). Beispielsweise können die
vorderen Kanäle
und der Centerkanal unter Verwendung von 20-Bit Wörtern codiert
werden und die hinteren Kanäle
und der Subwooferkanal unter Verwendung von 16-Bit Wörtern. Es
können
Datenwörter
mit jeder geeigneten Wortlänge
verwendet werden einschließlich
16-Bit Wörter, 18-Bit
Wörter,
20-Bit Wörter
und 24-Bit Wörter.
Falls gewünscht,
können
sowohl die zum Codieren von unterschiedlichen Audiokanälen verwendeten
Codierraten als auch die Wortlängen verändert werden.
-
Ein
Vorteil eines Audiokanalcodiersystems mit veränderlicher Auflösung gemäß der vorliegenden
Erfindung ist, dass es erlaubt, dass weniger wichtige Audioinformation
(solche wie die Information in den hinteren Kanälen und dem Subwooferkanal) mit
niedrigeren Codierraten und/oder Datenwortlängen codiert wird als die wichtigere
Audioinformation. Da mit einer geringeren Auflösung codierte Daten weniger
realer Platz auf der Disc verbraucht als mit einer höheren Auflösung codierte
Daten, erlaubt das selektive Codieren einiger Kanäle mit einer
niedrigen Auflösung,
das Beibehalten der Gesamtresourcen, welche durch den Audioinhalt
auf der Disc verbraucht wird ohne Verlust der Qualität des wichtigsten
Audioinhalts.
-
Da
zumindest der Subwooferkanal typischerweise mit einer niedrigen
Auflösung
als die anderen Kanäle
aufgezeichnet wird, wird Sechskanalaudio manchmal als 5.1 Audio
bezeichnet.
-
Ein
weiterer Aspekt der vorliegenden Erfindung betrifft die Möglichkeit
eines Wiedergabegerätes
für das
Speichermedium, um eine Zweikanal-(Stereo)Ausgabe bereitzustellen.
Diese Möglichkeit
ist wünschenswert,
da viele Verbraucher keine Audioausrüstung besitzen, die fähig ist
mit sechs Kanälen
umzugehen, sondern eine übliche
Zweikanalausrüstung
besitzen.
-
Eine
Art Zweikanalausgabe bereitzustellen besteht in der Ableitung der
Ausgabe aus den bestehenden sechs Audiokanälen auf der Disc. Das Ableiten
der Zweikanalausgabe umfasst das Anwenden geeigneter Mischwichtungen
auf jeden der sechs Kanäle.
Beispielsweise kann der linke Stereokanal durch Verwenden einer
50% Wichtung für
den linken vorderen Kanal, einer 50% Wichtung für den vorderen Centerkanal,
einer 50% Wichtung für
den linken hinteren Kanal und einer 50% Wichtung für den Subwoofer
abgeleitet werden. Der rechte Stereokanal kann durch Summierung
des rechten vorderen, des vorderen Center, des rechten hinteren
und des Subwooferkanals unter Verwendung der gleichen Wichtungen
abgeleitet werden.
-
Da
statische Wichtungskoeffizienten manchmal zu unerwünschten
akustischen Effekten führen, umfasst
die vorliegende Erfindung die Verwendung von dynamischen Wichtungskoeffizienten.
Diese Wichtungskoeffizienten, welche parallel mit den Audiodaten
auf dem Aufzeichnungsmedium codiert werden, erlauben es, dass die
Mischoperation so genau wie möglich
durchgeführt
wird. Da der Künstler
oder der Produzent die Möglichkeit
haben kann, seine Genehmigung zu der sich ergebenden Audiomischung zu
geben, erlauben es die eingebetteten Wichtungskoeffizienten dem
Künstler
oder dem Produzenten eine vorgegebene abgeleitete Audiomischung
zu bestätigen.
Dies erlaubt den Vorteil einer Kosteneinsparung der Ableitungstechnik,
ohne dass der Künstler oder
Produzent gezwungen wird, das Recht an der Kontrolle der endgültigen Mischung
abzutreten. Im Unterschied zu herkömmlichem DVD-Audio wird bei der
vorliegenden Erfindung das Mischen der Audiokanäle mit unterschiedlichen Auflösungen durchgeführt und
können
die Kanäle
zusammengemischt werden, während
sich die Audiodaten in ihrem erweiterten (unkomprimierten) Zustand
befinden.
-
Eine
andere Möglichkeit
zur Bereitstellung einer Zweikanalaudioausgabe besteht darin, einen festen
Zweikanal (Stereo) Datenstrom auf das Aufzeichnungsmedium zu codieren
anstatt die Ausgabe in Echtzeit abzuleiten. Statusbitdaten können verwendet
werden um anzuzeigen, ob die Zweikanalausgabe des Aufzeichnungsmediums
auf abgeleitete Daten oder auf feste Daten basiert. Das Aufzeichnungsmedium
der vorliegenden Erfindung erlaubt die Verwendung von mehreren unterschiedlichen
Audiocodierformaten zur Bereitstellung von vorgegebenen Zweikanalaudio,
sodass Produzenten von Audioinhalt und Disc-Hersteller mehrere Zweikanalcodieroptionen
besitzen. Geeignete Audiocodierformate umfassen Codierschemata mit ΔΣ Modulation,
lineares PCM, verlustfreie komprimierte ΔΣ Modulationscodierung, und verlustfreie
komprimierte PCM. Geeignete verlustfreie Kompressionsschemata zur
Verwendung bei der vorliegenden Erfindung sind das Huffman-Codier-Schema
und das Codierschema mit Lauflängencodierung
(run length encoding schemes).
-
Falls
gewünscht,
kann das Aufzeichnungsmedium dieser Erfindung herkömmliche
DVD Verschlüsselungstechniken
(z. B. 40 Bit Verschlüsselung)
verwenden um zu verhindern, dass nicht autorisierte Benutzer den
Inhalt des Aufzeichnungsmediums kopieren.
-
Audiodaten
auf dem Aufzeichnungsmedium sind vorzugsweise in 2 K-byte Sektoren gespeichert, welche
in 32 K-byte Blöcke
organisiert sind. Sektoren können
Audiodaten, Videodaten, Subbilder oder Subtiteldaten, und Programmzweiginformation
(die es einem Benutzer erlauben, während der Verwendung der Disc
zu unterschiedlichen Punkten innerhalb der Disc zu springen) enthalten.
Jeder 2 K-byte Audioinformation geht vorzugsweise ein ungefähr 48 Byte
langer Header voraus. (Die Größe dieses
Headers dient der Veranschaulichung und jede andere geeignete Größe kann
verwendet werden.) Vorzugsweise wird beim Aufzeichnungsmedium der
vorliegenden Erfindung die UDF-Spezifikation (Universal Disc Format)
verwendet, welche durch die OSTA (Optical Storage Trade Association)
verbreitet wurde. Eine Dateiverzeichnungsstruktur liegt auf der
Disc. Videoinformation (soweit bereitgestellt) wird in Sektoren
mit 156 Byte Headern gespeichert. Zusätzlich kann Videoinformation
der Audioinformation vorangehen (d. h. die Videoinformation auf
der Disc wird auf den inneren Spuren der Disc platziert, welche während der
Wiedergabe zuerst gelesen werden). Umgekehrt kann Audioinformation
der Videoinformation vorangehen (d. h. die Audioinformation auf
der Disc ist auf den inneren Spuren der Disc platziert, welche während der
Wiedergabe zuerst gelesen werden). Diese Formatierungsstandards
erlauben es Computern, die auf dem Aufzeichnungsmedium gespeicherten
Daten zu handhaben.
-
Mit
dem Auftauchen von digitalem Multikanalaudio haben sich die dem
Hörer bereitgestellte Steuerungsmöglichkeiten
drastisch erhöht.
Beispielsweise sind bei den meisten digitalen Multikanalaudiosystemen
Hörer in
der Lage, verschiedene Parameter wie vorne/hinten/rechts/links-Überblendung,
Nachhall als auch viele spezielle Audioeffekte, die sich auf solche
Effekte wie dreidimensionaler Schall beziehen, zu steuern – nicht
nur die üblicherweise
in den meisten Stereosystemen bereitgestellten Bass/Höhen- und Überblendparameter.
Hörer sind
sowohl in der Lage diese Parameter bei der Initialisierung zu steuern
(d. h. bei dem Start der Wiedergabe des Audiostückes) als auch während der Wiedergabe.
Für die
meisten Benutzer stellt diese erhöhte Steuerung der Parameter
der Wiedergabeumgebung ein verwirrendes Feld von Optionen dar. Um den
Hörer von
diesem häufig
zeitaufwendigen Initialisierungsverfahren der Parameter der Wiedergabeumgebung
zu befreien, können
Multikanalaudiodaten mit Systeminitialisierungsdaten ergänzt werden.
Dies erlaubt es dem Hörer
auch, das Audio in der Art zu hören,
wie es ursprünglich
durch den Künstler/Produzenten
vorgesehen war. Natürlich
sind diese gespeicherten Initialisierungsparameter lediglich Vorgabewerte
und können
durch den Hörer
zu jeder Zeit überschrieben
werden.
-
Ein
Teil eines jeden Sektors kann für
Daten mit programmierba rem Inhalt reserviert sein. Solche Daten
werden verwendet um Information zum Setzen von Parameter der Audioausstattung
des Benutzers auf der Basis von Vorgabeinformation bereitzustellen oder
basierend auf Tests, die durch das Audiosystem ausgeführt werden,
wenn die Disc gespielt wird. Ein typischer Test kann das Erzeugen
eines Testpulses umfassen und das Messen der Antwort der Hörumgebung
und des Audiosystems auf den Puls. Verzögerungszeiten und andere Parameter
können
dann basierend auf die Ergebnisse des Disctests eingestellt werden.
-
Zusätzlich kann
das Aufzeichnungsmedium der vorliegenden Erfindung Daten beinhalten
zur unterschiedlichen Konfigurierung der Einrichtung des Benutzers
für unterschiedliche
Musikselektionen (oder Teile von solchen Auswahlen). Musikselektionen,
welche eine hohe Auflösung
erfordern, werden mit hohen Codierraten codiert. Musikselektionen, welche
eine niedrige Auflösung
erfordern, werden mit niedrigeren Codierraten codiert. In der Disc
gespeicherte Konfigurationsinformation erlaubt es dem Wiedergabegerät des Benutzers
auf diese Änderungen
der Auflösung
während
der Wiedergabe zu reagieren. Solche Konfigurationsinformation wird
vorzugsweise in jedem Datensektor bereitgestellt. Andere Konfigurationsinformation,
die auf der Disc auf der Sektorebene bereitgestellt werden kann,
umfasst die für
die Ableitung einer Zweikanalaudioausgabe von einer Sechskanalaudiospur
auf der Disc verwendeten Mischkoeffizienten.
-
Daten
können
auf dem Aufzeichnungsmedium gespeichert werden um private Daten
und Merkmale mit bedingtem Zugang zu unterstützen. Beispielsweise können Daten
auf dem Speichermedium bereitgestellt werden, die schreibgeschützte Bereiche
des Speichermediums erlauben, welche Lieder oder andere Information
beinhalten, die durch den Benutzer freigeschaltet werden können. Der
Benutzer zahlt typischerweise eine Gebühr und empfängt einen digitalen Schlüssel zum
Freischalten der gewünschten
Information. Der digitale Schlüssel
kann über
das Internet, das Telefonnetz, ein Kabelfernsehnetz (z. B. unter
Verwendung eines Kabel modems oder während der vertikalen Austastinterwalle), Satellitensysteme
oder eine Kombination von solchen Bereitstellungsanordnungen gesendet
werden.
-
Informationen,
die über
ein LCD-Display oder andere geeignete Arten von Anzeigen auf dem Gerät des Benutzers
angezeigt werden, können
auf der Disc bereitgestellt werden. Solche Information kann während der
Discwiedergabe angezeigt werden. Beispielweise können Pixelmuster zum Anzeigen
der Lyrik einer musikalischen Auswahl bereitgestellt werden. Alternativ
können
auch ASCII oder ähnlich
codierte Textdaten verwendet werden. Pixelmuster sind vielseitiger
bei Anzeigesprachen, welche keine ASCII Buchstabensets verwenden,
jedoch benötigen
ASCII-artige Codes einen geringeren Speicher und erlauben es, dass
billigere Wiedergabegeräte
verwendet werden können.
-
Zusätzlich zu
Lyrik kann während
der Wiedergabe Information wie ein Albumtitel, die momentane Liedauswahl
und der Künstler
angezeigt werden. Wenn das gespielte Aufzeichnungsmedium direkt
an das Gerät
des Benutzers rundgesendet wird unter Verwendung von digitalen Sendetechniken
wie digitales Radio wird die auf der Disc codierte Anzeigeinformation
dem Benutzer bereitgestellt. Ein das Radio hörender Benutzer kann dann automatisch über die
gerade gespielte Auswahl informiert werden, auch wenn der Discjockey
der Radiostation, welcher die Auswahl spielt, den Titel des Liedes
nicht ansagt. Werbeinformation kann unter Verwendung ähnlicher Techniken
angezeigt werden. Das Pixelmuster und die ASCII-Daten, welche verwendet
werden um während
der Wiedergabe Information anzuzeigen, können in den Anfangsblöcken der
2 K-byte Datensektoren vorgesehen sein. Wenn eine große Menge
von Daten eingeschlossen ist, kann Information in einen gegebenen
Header auf einen geeigneten Datenort in dem Rest des Sektors zeigen,
wo das Pixelmuster oder die Textinformation gespeichert ist.
-
3 zeigt
eine bevorzugte Reihenfolge von Aufzeichnungsab tastungen auf einem
Sechskanal-Aufzeichnungsmedium des DVD-Typs. Die Abtastungen zwischen den Punkten
A und B (die Punkte A und B bestimmen einen Rahmen, d. h. eine Distanz
oder ein Zeitintervall zwischen zwei aufeinander folgenden Abtastungen
bei der niedrigsten Frequenz) werden alle in einem einzigen Zeitintervall
in der ursprünglichen
Information erfasst und umfassen eine 12 KHz Subwooferkanalabtastung,
vier 48 KHz Hinten-Links-Abtastungen,
vier 48 KHz Hinten-Rechts-Abtastungen, acht 96 KHz Vorne-Links-Abtastungen,
acht 96 KHz Vorne-Center-Abtastungen
und acht 96 KHz Vorne-Rechts-Abtastungen. Die bevorzugte Aufzeichnungsreihenfolge für diese
in 3 gezeigte Abtastungen ist derart, dass die Abtastungen
nacheinander von links nach rechts und von oben nach unten ausgelesen
werden. Somit ist die Aufzeichnungsreihenfolge bevorzugt derart,
dass das Auslesen der ersten Abtastung (an Punkt A) eine Abtastung
bei der niedrigsten Frequenz ist. Die nächsten ausgelesenen Abtastungen sind
Abtastungen einer mittleren Frequenz. Die nächsten ausgelesenen Abtastungen
sind Abtastungen bei der höchsten
Frequenz. Dann werden noch mehr Abtastungen bei einer mittleren
Frequenz ausgelesen, gefolgt von mehr Abtastungen bei der höchsten Frequenz.
Dieses Muster setzt sich fort bis es Zeit ist (bei Punkt B) um eine
weitere der Abtastungen mit niedrigster Frequenz auszulesen und dann
wiederholt sich das ganze Muster wieder von vorn.
-
Die
oben beschriebene Aufzeichnungsreihenfolge (und die sich ergebende
Auslesereihenfolge) stellt Abtastungen von dem Aufzeichnungsmedium
in annähernd
der Reihenfolge bereit, in welcher diese von der Wiedergabeschaltungsanordnung
(einschließlich
die zum Ableiten von Zweikanalstereo aus in Sechskanal aufgezeichneten
Informationen benötigte
Schaltungsanordnung) benötigt
wird. Dies wird aus der folgenden Beschreibung einer veranschaulichenden
Wiedergabeschaltungsanordnung verdeutlicht.
-
In
den in 4 gezeigten veranschaulichenden Wiedergabeschaltkreis 100 werden
die von der Disc des DVD-Typs gelesenen Abtastungen nacheinander
an den linken Anschluss des Demultiplexers 110 angelegt.
Der Demultiplexer 110 schaltet jede der aufeinander folgenden
Abtastungen auf den richtigen der sechs Ausgangskanäle der Wandlereinheit 112.
Beispielsweise wird jede Subwooferkanalabtastung auf den Subwooferkanal
geschaltet, der einen Subwooferkanal – Digital-zu-Analog-(D/A)Wandler 120S umfasst.
Dieser D/A Wandler wandelt die empfangenen Abtastungen in ein analoges
Subwooferausgangskanalsignal („SUBW.
Ausgang"). Ähnlich legt
der Demultiplexer 110 jede Hinten-links-Kanalabtastung auf den Hinten-links-Kanal
D/A-Wandler 120RL, welcher ein analoges Hinten-links-Ausgangskanalsignal
(„R.
L. Ausgang") erzeugt.
Jede Hinten-rechts-Kanalabtastung wird ähnlich an den Hinten-rechts-Kanal
D/A-Wandler 120RR gelegt. Und jede der Vorne-links-, Vorne-Center-,
Vorne-rechts-Kanal-Abtastungen
werden ähnlich
an die D/A-Wandler 120FL, 120FC bzw. 120FR angelegt. Somit
sind die rechts in 4 gezeigten oberen sechs Ausgaben
sechs analoge Signale zum Verwenden in einem Sechskanalaudiosystem.
-
4 zeigt
auch wie die linken und rechten Zweikanal-Stereoausgaben aus den Sechskanalsignalen
abgeleitet werden können.
Das linke Stereoausgabesignal („Stereo linker Ausgang") wird durch geeignetes
Wichten des Subw. Ausgangssignals, des R. L. Ausgangssignals, des
F. L. Ausgangssignals und des F. C. Ausgangssignals und durch Verknüpfen der
sich ergebenden Signale erzeugt. Operationsverstärker 130SL, 130RLL, 130FLL bzw. 130FCL werden
verwendet um diese Signale für
das Verknüpfen
zu wichten um das Signal Stereo-linker-Ausgang zu erzeugen. Ähnlich wird
das Signal Stereo-rechter-Rusgang erzeugt durch das geeignete Wichten
des Subw. Ausgangssignals, des R. R. Ausgangssignals, des F. C.
Ausgangssignals und des F. R. Ausgangssignals (unter Verwendung
von Operationsverstärkern 130SR, 130RRR, 130FCR bzw. 130FRR)
und durch das Verknüpfen
der sich ergebenden Signale. Die durch die Operationsverstärker 130 verwendeten
Wichtungsfaktoren werden über
Zuleitungen 140 zugeführt.
-
5 zeigt
eine alternative Ausführungsform
der Wandlereinheit 112 der 4, bei welcher die
Zweikanal-Stereosignale aus den Sechskanal-Audiosignalen auf der
digitalen Ebene (statt auf der analogen Ebene wie in 4 durchgeführt) abgeleitet
werden. In 5 sind die Elemente 130 digitale
Multiplizierer zum Multiplizieren von aufeinander folgenden Abtastungen
von dem Demultiplexer 110 mit verschiedenen, geeigneten
digitalen Wichtungsfaktoren, die über die Zuleitungen 140 zugeführt werden.
Die Elemente 132L und 132R sind digitale Addierer
zum Verknüpfen
der Ausgaben der Multiplizierer 130, welche zu dem linken
bzw. rechten Stereokanal beitragen. D/A-Wandler 120SL bzw. 120SR wandeln
die digitalen Ausgaben der Addierer 132L und 132R in
die analogen Signale des linken und rechten Stereoausgangs. Im Hinblick
auf alle anderen Aspekte ist 5 ähnlich zu 4.
Es ist zu beachten, dass einige der Multiplizierer 130 die
von dem Demultiplexer 110 empfangenen Eingaben zurückgewinnen
und wieder verwenden bis die neue Abtastung von dem Demultiplexer 110 für diesen Multiplizierer
kommt, damit jeder Addierer 132 während eines jeden Betriebszyklus
des Addierers etwas von seinem zugeordneten Multiplizierer 130 empfängt.
-
Durch
das Studieren von 3 zusammen mit 4 oder 3 zusammen
mit 5 wird klar, dass die in 3 gezeigte
Reihenfolge der Aufzeichnung und die sich ergebende Wiedergabe Abtastungen
von dem Aufzeichnungsmedium in einer Reihenfolge erzeugt, welche
sehr nah zur Reihenfolge liegt, in welcher diese Abtastungen durch
die D/A-Wandler 120 in den verschiedenen Kanälen in 4 benötigt werden,
oder durch die entsprechenden D/A-Wandler 120 und die digitalen
Komponenten 130 und 132 in 5. Diese
Reihenfolge der Abtastungen vermindert somit den benötigten Pufferumfang
in den verschiedenen D/A-Wandlern und digitalen Komponenten um die
Daten über
die verschiedenen Kanäle
wieder zu synchronisieren und um die Rate der Abtastungen in jedem
Kanal wieder auszugleichen.
-
Das
Folgende ist eine veranschaulichende, zusammenfassende Spe zifikation
gemäß dieser
Erfindung (wie obenstehend ausführlicher
beschrieben) für
ein DVD-artiges Disc-Aufzeichnungsmedium für Audioinformation:
-
Bevorzugte
Discparameter
-
5.1
(sechs Kanäle)
-
Fähigkeit
zum abgeleiteten Zweikanalmischen.
-
Komprimiert
oder unkomprimiert.
-
Abtastrate
44,1 KHz oder 48 KHz, 88,2 KHz oder 96 KHz, 176,4 KHz oder 192 KHz;
Subwoofer 11,025 KHz oder 12 KHz.
-
Jedes
Schallfeld (z. B. vorne und hinten) ist ein ganzzahliges Vielfaches
eines anderen in Bezug auf die Abtastraten (d. h. 12, 48, 96 KHz
oder 11,025, 44,1, und 88 KHz).
-
Verlustfreie
Codierung (d. h. Huffman-Codierung oder Lauflängencodierung oder beide).
-
Verschlüsselung
(40 Bit).
-
Im
Discformat spezifizierte reservierte Daten mit programmierbarem
Inhalt.
-
Musikselektionskonfiguration – jeder
Block umfasst einen Header um programmierbaren Inhalt zu unterstützen, Abtastratenidentifikation,
Wortlängenidentifikation,
Wortlängenskalierfaktor,
Koeffizienten zum abgeleiteten Zweikanalmischen, etc.
-
Private
Daten/bedingter Zugang.
-
Anzeigedaten – reservierte
Daten für
CD textähnliche
Anzeige; Pixelmusteranzeige wie bei DVD wie bei DVD Video; ASCII
zur Verwendung bei Musikautomat-Abspielgeräten (Albumtitel, Liedtitel, Künstler)
zur Verwendung für
eine LCD-Anzeige.
-
Optionale
Discparameter
-
Beachte:
Alle optionalen Positionen müssen in
der Disc-Formatspezifikation
als Daten mit programmierbarem Inhalt reserviert sein.
-
Getrennte
Zweikanalmischung (LPCM) mit spezifizierten Abtastraten und Bittiefen;
wenn Zweikanalmischen eingeschlossen ist, sind abgeleitete Zweikanaldaten
nicht erforderlich, und Zweikanalmischstatusbits sind eingeschlossen.
-
Andere
alternative Codierschemata (z. B. ΔΣ). (Falls verwendet, muss abgeleitete
Zweikanalinformation eingeschlossen sein.)
-
MPEG
Video (wird oberhalb der UDF Schicht liegen unter Verwendung bestehender
Standards einschließlich
LPCM und/oder AC-3.)
-
Text
und Grafiken. Verwenden von Karaoke-definierten Subbild- und MPEG I Rahmenspezifikationen.
(übereinstimmend
mit DVD-Videospezifikationen.)
-
In 6 ist
ein Flussdiagramm bereitgestellt, das ein Verfahren zum Aufnehmen
und Wiedergeben von digitalen Multikanalaudiosignal-Abtastungen
veranschaulicht, die bei unterschiedlichen Abtastraten aufgenommen
wurden. Eine Mehrzahl von Audiodatenkanälen wird in Schritt 400 abgetastet,
sodass wenigstens zwei Kanäle
aus der Mehrzahl von Kanälen bei
unterschiedlichen Raten abgetastet werden. Die Abtastungen der Mehrzahl
von Audiodatenkanälen werden
in Schritt 410 in annähernd
der während
der Wiedergabe benötigten
Reihenfolge angeordnet. Die Abtastungen der Mehrzahl von Audiodatenkanälen werden
in Schritt 430 in Rahmen zusammengestellt. Die Wichtungsinformation
zum Ableiten von Stereo wird optional in Schritt 420 bereitgestellt.
Diese Wichtungsinformation kann in der gleichen Spur wie die Mehrzahl von
Audiodatenkanälen
oder in einer getrennten Spur bereitgestellt werden. Die Rahmen
und die Wichtungsinformation werden in Schritt 440 auf den
Softwareträger
aufgezeichnet. Auf die auf dem Softwareträger gespeicherten Rahmen und
die Wichtungsinformation wird in Schritt 450 zugegriffen.
Die Audiodatenabtastungen werden in Schritt 460 von einer
digitalen Form in eine analoge Form umgewandelt, sodass das Audioprogramm
wiedergegeben werden kann.
-
Das
digitale Multikanalaudiosystem der vorliegenden Erfindung kann auch
ein intelligentes Systeminitialisierungsmerkmal aufweisen. Dieses
Merkmal ermöglicht
es dem Hörer,
auf das häufig
zeitaufwendige Verfahren der Initialisierung von Parametern der
Wiedergabeeinrichtung zu verzichten und erlaubt es dem Hörer, dass
Audio in der Art zu hören,
wie es ursprünglich
durch den Künstler/Produzenten
gedacht war. Die auf dem Softwareträger gespeicherten Multikanalaudiodaten
werden von Systeminitialisierungsdaten begleitet, die üblicherweise
auf einer Spur bereitgestellt werden, welche von der oder den Audiodaten-Spuren
getrennt ist. Die Systeminitialisierungsdaten können jedoch auch zwischen Audiodaten
in der gleichen Weise wie irgendein Audiodatenkanal auf einer einzelnen
Spur eingefügt
werden.
-
Es
ist zur Kenntnis zu nehmen, dass das Vorstehende nur veranschaulichend
für die
Prinzipien dieser Erfindung ist und dass verschiedene Modifikationen
durch Fachleute durchgeführt
werden können.