-
HINTERGRUND
DER ERFINDUNG
-
Gebiet der
Erfindung
-
Diese
Erfindung betrifft ein Verfahren und eine Vorrichtung zum signifikanten
Erweitern der effektiven Kapazität
von Laser Disks, Compact Disks, Digital Audio Tape und anderen herkömmlichen
digitalen Audioaufzeichnungsmedien, und insbesondere ein Verfahren
und eine zugeordnete Vorrichtung zum Multiplexieren mehrerer digitaler
Audiosignale auf die Datenkanäle,
welche derzeitig von den pulscodemodulierten (PCM) Digitalaudiokanälen auf
einen derartigen Aufzeichnungsmedium belegt werden.
-
Beschreibung
des Stands der Technik
-
Ein
derzeitiges Standardconsumer-Digitalaudioformat ist ein Zweikanal-Stereo
16-Bit Linear PCM System. Dieser Codierungstyp wird für Compact
Disks (CDs), Laser Disks und Digitalaudio Tape (DAT) sowie professionelle
digitale Bandaufzeichnungsgeräte
verwendet. Es stellt zwei Audiokanäle mit etwas mehr als 90 dB
Dynamikbereich und Aufzeichnungszeiten in der Größenordnung von einer Stunde
für eine
herkömmliche
CD zur Verfügung. Eine
Hierarchie von Fehlerkorrekturtechniken wird angewendet, um Bitfehler
zu detektieren und zu korrigieren, was zu einem System führt, das
eine zuverlässige,
hochqualitative Stereoaufzeichnung bereitstellt.
-
Obwohl
16-Bit lineares Digitalaudio eine Audioaufzeichnung mit guter Qualität bereitstellt,
hat sie nicht die von Audiophilen gewünschten sehr hohen Qualitätsstandards
erfüllt.
Neue 20-Bit Analog/Digital-Codierer und Digital/Analog-Decodierer
sind verfügbar
geworden, wobei aber diese Vorrichtungen nicht mit der bei den derzeitigen
CDs und Laser Disks verwendeten 16 Bit Linear PCM Technologie kompatibel
sind, wodurch die verbesserte Qualität der neuen Codierer und Decodierer
daher nicht mit dem derzeitigen digitalen Audiostandard realisiert
werden kann.
-
Die
Einschränkung
der herkömmlichen
digitalen Audioaufzeichnungsmedien auf Zweikanal-Stereo und etwa
eine Stunde Aufzeichnungszeit ist ebenfalls unerwünscht. Die
Bereitstellung eines Sechskanal-Tons würde beispielsweise das Potential für eine Hörerfahrung, ähnlich dem
einer voll ausgestatteten Sechspur-Theaterumgebung erzeugen. Ferner
wäre die
Fähigkeit,
deutlich mehr als eine Stunde an Ton auf nur einer Platte aufzuzeichnen,
in vielen Fällen
vorteilhaft, während
die sehr schnelle Zugriffsfähigkeit
auf dir Disk immer noch einen schnellen und bequemen Zugriff auf
einen gewünschten
Abschnitt der Aufzeichnung erlauben würde.
-
Das
Dokument EP-A2-0411988 offenbart einen Signalprozessor für einen
Digital Audio Tape Rekorder, welcher die Signalverarbeitung zum
Aufzeichnen von 4-Kanal PCM-Signalen
in der Form von 2-Kanal PCM-Signalen durchführt. Die 4 Kanäle werden
mit 32 kHz (Fs) abgetastet. Um diese Abtastwerte in
Echtzeit auf einem 2-Kanal-Aufzeichnungsmedium aufzuzeichnen
werden die vier Abtastwerte gepuffert und dann mit 64 kHz (2Fs) ausgegeben. Die 64 kHz Signale werden
zeitmultiplexiert (vier Kanäle
in zwei Kanäle)
und die sich ergebenden zwei Kanäle
werden mit 64 kHz aufgezeichnet. Diese "Zeitbasiskompression" erhöht
die Anzahl der Bits pro Sekunde.
-
Das
Dokument US-A-4547816 offenbart ein Verfahren zum Aufzeichnen von
digitalen Audio- und Videosignalen in der selben Spur und Ermöglichen der
gemeinsamen Nutzung der Verarbeitungskanäle, während es ermöglicht wird,
die Fehlerrate in der Verarbeitung von Audiosignalen zu reduzieren.
Die Zeitbasiskompression des Audiosignals ist so mit der Bitrate
der Videosignale korreliert, dass die minimale Wellenlänge der
aufgezeichneten digital codierten Audiosignale größer die
minimale Wellenlänge
der aufgezeichneten digital codierten Videosignale ist. Somit muss
das minimal mögliche
Zeitintervall zwischen zwei aufeinander folgenden Pegeländerungen in
dem Audiosignal größer als
das minimal mögliche Zeitintervall
zwischen zwei aufeinander folgenden Pegeländerungen in dem Audiosignal
größer als
das minimal mögliche
Zeitintervall zwischen zwei aufeinander folgenden Pegeländerungen
in dem Videosignal sein. Damit eine bestimmte Anzahl von gemeinsamen
Stufen, sowohl Video- als auch Audiosignale verarbeiten kann, muss
das minimal mögliche
Zeitintervall in den Audiosignalen ein ganzzahliges Vielfaches des
minimal möglichen
Zeitintervalls für
die Videosignale sein. Der Vorteil dieses Verfahrens besteht darin,
dass die mittlere Fehlerrate in der Aufzeichnung digital codierter
Aufzeichnungssignale wesentlich niedriger als die für digital
codierte Videosignale ist. Ebenso wird eine Zeitbasiskompression, welche
die Daten aus einem 16-Bit Byte zu einem 8 + 8 Format umformatiert,
verwendet. Diese Konzepte vermeiden das Reduzieren der Anzahl von
Bits pro Abtastwert.
-
Das
Dokument EP-A-0520444 offenbart ein Verfahren und eine Vorrichtung
zum Aufzeichnen komprimierter Audiodaten auf einem Video-Aufzeichnungsmedium.
-
Video-
und Audiodaten werden auf Video- und Audiosignal-Aufzeichnungsbereichen
einer Spur eines Aufzeichnungsmediums aufgezeichnet, wobei diese
Bereiche entweder in einem von mehreren Segmenten in der Spur enthalten
sind, oder die Spur aus nur einem Segment von Video- und Audiosignalaufzeichnungsbereichen
besteht. Audiodaten, die im wesentlichen zum selben Zeitpunkt wie
die Videodaten geliefert werden, werden komprimiert und in einem
ersten Audiosektor des Audiosignalaufzeichnungsbereichs aufgezeichnet.
Dann werden, abhängig
davon, ob ein erster oder zweiter Audiosignalaufzeichnungsmodus
gewählt
ist, entweder komprimierte Audiodaten, welche aus den im wesentlichen
zum selben Zeitpunkt wie die Videodaten gelieferten Audiodaten abgeleitet
werden, oder unabhängig
komprimierte Audiodaten geliefert. Die abgeleiteten oder unabhängig komprimierten
Audiodaten werden in einem zweiten Audiosektor des Audiosignalaufzeichnungsbereiches
ausgezeichnet.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Die
vorliegende Erfindung stellt ein Verfahren zum Aufzeichnen von digitaler
Mehrkanal-Audioinformationen
mit einer vorbestimmten Datenbitrate auf einem permanenten digitalen
Speichermedium bereit, das die Schritte umfasst:
Bereitstellen
eines permanenten digitalen Speichermediums, das digitale Audiosignale
speichern kann, die es in einem vorbestimmten Format und mit einer Datenbitrate
empfängt,
die eine vorbestimmte maximale Datenbitrate nicht überschreitet;
Zuführen von
digitalen Mehrkanal-Eingangsaudiosignalen (CH1, CH2, ... CHn) mit
einer Summendatenbitrate, die die maximale Datenbitrate überschreitet;
Komprimieren
(C1, C2, ... Cn) der digitalen Mehrkanal-Eingangsaudiosignale durch
Reduzieren ihrer Anzahl von Bits pro Abtastwert, so dass die Summendatenbitrate
der komprimierten Signale die maximale Datenbitrate des Speichermediums
nicht überschreitet;
Multiplexieren
der komprimierten digitalen Audiosignale in ein multiplexiertes
Signal mit einer Datenbitrate, die die maximale Datenbitrate des
Speichermediums nicht überschreitet;
Codieren
des multiplexierten Signals in das vorbestimmte Format; und
Aufzeichnen
des genannten codierten Signals auf dem digitalen Speichermedium.
-
Einer
der vorteilhaften Effekte der vorliegenden Erfindung besteht in
der Bereitstellung eines Verfahrens und einer Vorrichtung zum Speichern
von digitalem Mehrkanalaudio mit wesentlich höherer Qualität auf den
digitalen Stereokanälen
herkömmlicher Audioaufzeichnungsmedien,
wie z. B. CDs, Laser Disks und DATs und/oder in der Erzeugung einer
längeren
Aufzeichnung als einer, zu der das Medium üblicherweise fähig ist.
Das System ist flexibel genug, um zahlreiche unterschiedliche Arten
von Audioeingangssignal zu handhaben und erfordert keine exotischen
neuen Komponenten. Diese vorteilhaften Effekte werden durch Reduzieren
der Anzahl pro Bits pro Abtastwert des digitalen Mehrkanal-Eingangaudiosignals
erreicht, um komprimierte Signale zu erhalten, so dass die Summendatenbitrate
nicht die maximale Datenbitrate des Audiospeichermediums überschreitet.
Die komprimierten Signale werden dann miteinander multiplexiert,
um ein multiplexiertes Signal mit einer Datenbitrate zu erzeugen,
das die maximale Kapazität
des Speichermediums nicht überschreitet.
Nach der Codierung in ein Format, welches von dem Aufzeichnungsmedium
verwendet wird, wie z. B. in das herkömmliche AES/EBU, wird das multiplexierte
Signal auf dem Speichermedium aufgezeichnet. Eine Wiedergabe wird
erreicht, indem die aufgezeichneten Signal aus dem Speichermedium ausgelesen,
die ausgelesenen Signale in einer zur Codierung komplementären Art
decodiert werden, die decodierten Signale in einer zur Multiplexierung komplementären Art
decodiert werden und die demultiplexierten Signale in einer zu der
Kompression komplementären
Art dekomprimiert werden. Die dekomprimierten Signale können dann durch
einen Digital/Analog-Wandler (DAT) verarbeitet und an Lautsprecher
geliefert werden.
-
Der
Kompressionsfaktor wird auf die Datenbitraten der Eingangssignalkanäle, die
Datenbitratenfähigkeit
des Aufzeichnungsmediums und die Anzahl von Eingangskanälen bezogen
so ausgewählt, dass
die Summendatenbitrate der Eingangssignale nach der Kompression
nicht das Fassungsvermögen des
Aufzeichnungsmediums überschreitet.
Bei dem zum Speichern von Audioabtastwerten mit seiner vorbestimmten
Anzahl von Bits pro Abtastwert konfigurierten Aufzeichnungsmedium
werden die komprimierten Eingangssignale in Datengruppen mit derselben
Anzahl von Bits multiplexiert. Obwohl dieses dazu führt, dass
einige von den Eingangsabtastwerten unter unterschiedlichen Datengruppen
aufgeteilt werden, stellt der komplementäre Decodierungsprozess die
Integrität
der ursprünglichen
Abtastwerte wieder her.
-
Zur
Anpassung an unterschiedliche Eingangsformate, welche unterschiedliche
Arten von Multiplexierung erfordern, kann ein Kennungscode zusammen
mit den Eingangssignalen aufgezeichnet werden, um sicherzustellen,
dass die Demultiplexierung in einer komplementären Weise durchgeführt wird.
Dieses kann erreicht werden, indem ein Bit der 32-Bit AES/EBU Subrahmen
speziell einer Kennung zugeordnet wird, oder indem ein getrennter
Moduskennungseingang bereitgestellt wird. Wenn eine große Anzahl
von Eingangsspuren vorhanden ist, wie beispielsweise, wenn eine
ausgedehnte Länge
einer Eingangsspur mit relativ niedriger Qualität in eine große Anzahl
von Subkanälen
für aufeinanderfolgende
Codierung unterteilt wird, können
Zwischenspeichermedium verwendet werden, um die entsprechenden Gruppen
der Eingangskanäle
für die
Multiplexierung zu kompilieren.
-
Diese
und weitere Merkmale und Vorteile der Erfindung werden für den Fachmann
auf diesem Gebiet aus der nachstehenden detaillierten Beschreibung
in Verbindung mit den beigefügten
Zeichnungen ersichtlich.
-
Hierin
nachstehend können
die vorstehend beschriebenen Kompressionstechniken als "Komprimieren der
Datenbitrate" bezeichnet
werden.
-
KURZBESCHREIBUNG
DER ZEICHNUNGEN
-
1 ist
eine Blockdarstellung eines Systems zum Codieren von mehreren digitalen
Audio-Eingangssignalen auf ein digitales Speichermedium, das eine
kleinere Kapazität
als die Summe der Eingangssignale besitzt;
-
2 ist
eine Blockdarstellung eines Decodierersystems zum Wiedergeben der
digitalen Audiosignale aus dem Speichermedium;
-
3 ist
eine Darstellung, die die Kompression und Multiplexierung von Audioeingangssignalen höherer Bitordnung
in einem Datenstrom niedrigerer Bitordnung zum Aufzeichnen auf einem
Audiospeichermedium veranschaulicht.
-
4 ist
eine Blockdarstellung eines alternativen Multiplexierungsverfahrens
für eine
große Anzahl
von Eingangsdatenkanälen;
-
5 ist
eine Datendarstellung, welche den herkömmlichen AES/EBU-Schnittstellenstandard darstellt,
der in einer bevorzugten Ausführungsform der
Erfindung verwendet wird; und
-
6A1 bis 6A7 und 6B1 bis 6B3 bilden
zusammen ein Schaltbild eines AES/EBU-Formatierers, der in der bevorzugten
Ausführungsform
verwendet wird; und
-
7A1 bis 7A7, 7B1, 6B3 und 7C1 bis 7C3 bilden
zusammen ein Schaltbild eines Decodierers, der in der bevorzugten Ausführungsform
verwendet wird.
-
DETAILLIERTE
BESCHREIBUNG
-
Die
Erfindung stellt eine Möglichkeit
bereit, sechs oder sogar mehr Digitalaudiokanäle mit sehr hoher Qualität (d. h.,
20 Bit) kompatibel auf herkömmliche
Stereo PCM-Datenbitströme zu codieren, und
dadurch erheblich die effektive Datenspeicherkapazität digitaler
Audiospeichermedien, wie z. B. CDs, Laser Disks und DATs zu erweitern.
Beispielsweise können
auf einer CD, die normalerweise nur etwa eine Stunde Stereo (2-Kanal) 16-Bit Audio
fasst, entweder eine Stunde Sechsspur Super Hi-Fi 20-Bit Audio, vier
Stunden 16-Bit Stereo Digital Audio oder 40 Stunden AM Funkqualität Audio
aufgezeichnet werden.
-
Eine
Blockdarstellung des Codierungssystems ist in 1 gegeben.
Mehrere Spuren digitaler Audioeingangssignale CH1, CH2 ... CHn werden
in einem linearen digitalen Audioformat, typischerweise 16, 18 oder
20 Bits pro Abtastwert bereitgestellt. Wenn die Erfindung dazu genutzt
wird, sechs Kanäle von
digitalen Audiosignale mit ultrahoher Qualität von 20-20 KHz Bandbreite
aufzuzeichnen, liegen die Eingangsdaten in der Form eines linearen
20-Bit PCM Signals mit einer Abtastrate von 24100 Abtastwerten/Sekunde
vor, welche dieselbe Abtastrate für ein herkömmliches linear codiertes 16
Bit Audiosignal ist. Für
eine Langzeit AM Qualität
Audiocodierung könnten
40 Kanäle
von 20-4 KHz 16-Bit Linear PCMs, abgetastet mit 8820 Abtastwerten
pro Sekunde in das System eingegeben werden.
-
Jedes
von den n Eingangssignalen wird einen entsprechenden Datenkompressor
C1, C2 ... Cn zugeführt,
welcher das eingegebene Digitalaudio in eine niedrigere Datenbitrate
komprimiert. Datenbitraten-Kompressoren dieses Typs wurden früher für Echtzeitfunk-
und Fernsehübertragung
verwendet und dieselben Kompressortypen könnten für diese neue Anwendung verwendet
werden. Zu geeigneten Datenkompressoren zählen der Audio Processing Technology
Inc. APTX 100, welcher die Datenbitrate um ein Faktor von vier reduziert,
der Dolby®AC-3,
der Sony®ATRAC
und die European Musician Compressions Algorithms.
-
Der
Datenkompressionsalgorithmus wird so gewählt, dass die Summe der Datenbitraten
aus den Ausgängen
aller Kompressoren zusammen genommen nicht die Datenbitrate für die herkömmlichen zwei
Kanäle
des 16-Bit Linear PCM Audio überschreitet.
Beispielsweise stellt, wenn sechs Eingangskanäle mit 20-Bit Daten vorliegen,
ein 4:1 Kompressionsverhältnis
eine ausreichende Kompression bereit. Jeder von den sechs 20-Bit
Eingangskanälen besitzt
eine Datenbitrate, die das 1,25-fache der Datenbitrate der 16-Bit Stereokanäle ist,
und es sind dreimal so viele Eingangskanäle wie Stereokanäle vorhanden.
Die Summeneingangssignaldatenrate vor der Kompression ist daher
das 3,75-fache der 16-Bit
Datenbitrate. Eine Kompression der Datenbitrate der Eingangssignale
um einen Faktor von 4 genügt
daher der Notwendigkeit, dass die komprimierte Summeneingangsdatenbitrate
nicht die 16 Bit Stereodatenbitrate überschreitet.
-
Die
komprimierten Audiosignale werden miteinander mittels eines Multiplexers 2 multiplexiert. Die
Multiplexierung kann in einer Reihe unterschiedlicher Arten erreicht
werden. Die Einfachste besteht in einem Zyklus durch die komprimierten
Eingangssignale in einer wiederholenden Weise, welche sequentiell
ein Bit oder eine Gruppe von Bits aus jedem komprimierten Eingangssignal
bei jedem Zyklus entnimmt. In der nachstehend detailliert beschriebenen bevorzugten
Ausführungsform
werden 16-Bit Datenblöcke
von jedem Kompressor im Umlauf entnommen, um ein multiplexiertes
Ausgangssignal zu erzeugen, das in der Datenbitrate zu einem 16-Bit Zweikanal-Stereosignal äquivalent
ist.
-
In
dem Multiplexierungsprozess ist es erwünscht, dass die multiplexierten
Daten in den Datenblöcken
des bevorzugten AES/EBU-Formats positionsstabil sind, so dass Interpolation
und Ersetzungen durch den Fehlerkorrigierer des Basis-CD oder anderen
digitalen Speichermediums einen minimalen Audiofehler in den endgültigen multiplexierten
Signalen erzeugen, wenn diese wiedergegeben werden. Wenn, wie in
dem Falle der vorstehend diskutierten Sechskanal 20-Bit Eingangsaudiosignale
die Summendatenrate aus den Kompressoren kleiner als die 16-Bit
Linear PCM Stereodatenrate ist, kann eine zusätzliche Bitfehlerkorrektur
in den digitalen Multiplexierer unter Verwendung herkömmlicher
Fehlerkorrekturchipsätze,
wie z. B. den Reed Solomon Fehlerkorrekturcode eingefügt werden.
-
Das
Ausgangssignal aus dem Multiplexer 2 kann optional in einer
Datendatei 4, wie z. B. auf einer Computerfestplatte gespeichert
werden, wobei eine zusätzliche
Verarbeitung, wie z. B. Editierungsfunktionen oder die Hinzufügung von
Synchronisationssignalen durchgeführt werden kann. Das multiplexierte
Signal wird dann einem herkömmlichen
Formatierer 6 zugeführt,
welcher es in ein geeignetes Format zum Aufzeichnen auf einen digitalen
Audiospeichermedium umsetzt; das herkömmliche Format zum Zeitpunkt
dieser Anmeldung ist AES/EBU. Das multiplexierte Signal ist zu zwei
Kanälen
eines 16-Bit linear
PCM in der Datenrate kompatibel und erscheint somit dem AES/EBU-Formatierer 6 als
ein herkömmliches
Stereosignal. Geeignete Formatierer werden von verschiedenen Firmen
hergestellt, wie z. B. die CS8401 CS8402 digitalen Audioschnittstellensender
von Crystal Semiconductor Corporation.
-
Um
die Flexibilität
der Behandlung unterschiedlicher Typen von Eingangsaudiosignalen
zu maximieren, sollte der Multiplexer 2 einstellbar sein, um
unterschiedliche Anzahlen von Eingangssignalen aufzunehmen, und
um eine Auswählbarkeit
der Anzahl von Datenbits zu ermöglichen,
die aus diesem Kanal während
eines Multiplexzyklus entnommen werden. Der herkömmliche AES/EBU-Formatierer (auch
als Schnittstellensender bezeichnet) enthält einen Benutzerbit-Eingabeport 8,
der ein Aufzeichnen des Multiplexmodus innerhalb des AES/EBU-Bitstroms
ermöglicht.
Wenn dieser Bitstrom während der
Wiedergabe aus dem digitalen Aufzeichnungsmedium decodiert wird,
wird die Multiplexmodusinformation verwendet, um die Demultiplexierung
zu steuern. Alternativ könnte
ein Schieberegister hinzugefügt
werden, um komprimierte Benutzerinformation direkt in den 20 Bitaudiodatenabschnitt
des AES/EBU-Formates einzufügen,
welches nachstehend beschrieben wird. Die formatierten digitalen
Audiodaten werden mittels eines herkömmlichen digitalen Rekorders 10 auf
einem digitalen Aufzeichnungsmedium 12 wie z. B. einer
CD, einer Laser Disk, DAT oder irgend einem anderen digitalen Aufzeichnungsmediumkonstruktion
aufgezeichnet.
-
Ein
Decodierungssystem, das die aufgezeichneten digitalen Audiodaten
in analoge Tonsignale zum Steuern von Lautsprecher umwandelt, ist
in 2 dargestellt. Es umfasst eine herkömmliche
digitale Wiedergabevorrichtung 14, welche die auf dem Speichermedium
aufgezeichneten Audiodaten abtastet und die Daten als einen seriellen
Bitstrom im AES/EBU-Standard ausgibt. Ein AES/EBU-Schnittstellenempfänger, wie
z. B. der Crystal Semiconductor Corp. CS8411 oder CS8412 arbeitet
in einer zu dem AES/EBU-Formatierers 6 in 1 komplementären Weise,
um ein Ausgangssignal zu erzeugen, das zu zwei Kanälen einer
16-Bit Linear PCM äquivalent
ist. Das Ausgangssignal des AES/EBU-Schnittstellenempfängers 16 wird
von einem Demultiplexer 18 demultiplexiert, welcher in
einer zu dem Multiplexer 2 von 1 komplementären Weise
arbeitet. Die AES/EBU-Benutzerbits können von einer optionalen Mikroprozessorsteuerung 20 gelesen
werden und dazu genutzt werden, um mittels eines an den Demultiplexer 18 über die
Ausgabeleistung 22 gelieferten geeigneten Steuersignals
eines von einer Vielzahl von in dem Codierungsprozessor verwendeten Multiplexierungsverfahren
auszuwählen.
Der Demultiplexierungsmodus kann alternativ manuell, entweder direkt
oder über
einen Benutzereingabeport 24 in die Steuerung gewählt werden.
Ein weiteres Ausgangssignal 26 aus der Steuerung legt die
Abtasttaktrate des Systemtakts 28 fest. Beispielsweise
wird in dem Falle einer verlängerten
Aufzeichnung in AM-Qualität
im Ge gensatz zu einer Aufzeichnung mit Hi-Fi-Qualität die Abtastrate
von 44100 auf 8820 Abtastungen pro Sekunde reduziert; die Abtastrate muss
mit der in dem Aufzeichnungsprozess verwendeten Abtastrate übereinstimmen.
-
Die
aus dem Demultiplexer 18 ausgegebenen Bitströme werden
den digitalen Audiodekompressoren D1, D2 ... Dn in einer komplementären Weise
zu dem Zugriff auf die komprimierten Audioeingangssignale von den
Kompressoren C1, C2 ... Cn durch den Multiplexer 2 in 1 zugeführt. Schließlich werden
die Ausgangssignale aus den Dekompressoren D1, D2 ... Dn an entsprechende
Digital/Analog-Wandler DAC1, DAC2 ... DACn geliefert. Hier werden
sie in Analogsignale umgewandelt, die über Ausgabeleistungen O1, O2
... On zum Steuern von Lautsprechern übertragen werden. Im Falle
der höchsten
derzeitigen digitalen Audioqualität können die Ausgangssignale aus
den DACs ein bis zu 22 oder sogar 24-Bit Linear PCM Code sein.
-
3 stellt
die Art dar, in welcher mehrere Audioeingangssignale, welche Audiosignale
mit sehr hoher Qualität,
wie z. B. 20-Bit transportieren, von dem System von 1 in
Signale verarbeitet werden, die ein herkömmliches 16-Bit Stereoeingangssignal
für den
AES/EBU-Formatierer 6 emulieren. Die Eingangskanäle CH1, CH2 ... CHn sind als
entsprechende serielle Bitströme
dargestellt, die aus 20-Bit Abtastwerten S1, S2, S3, S4 usw. bestehen.
Diese Eingangssignale werden von Kompressoren C1, C2 ... Cn in 5-Bit
komprimierte Abtastwerte CS1, CS2, CS3, CS4 usw. komprimiert. Der
Multiplexer führt zwei
Zyklen durch die komprimierten Kanäle unter Aufnahme von 16 Bits
pro Kanal in jedem Zyklus durch. Dieses repräsentiert die Bits aus drei
kompletten Abtastwerten plus einem zusätzlichen Bit aus einem vierten
Abastwert. In 3 wird ein Wort 30 aus dem
CH1, bestehend aus drei 5-Bit Abtastwerten plus den ersten Bit aus
einem vierten Abtastwert in dem Datenbitstrom für den Kanal 1 durch
den Multiplexer erfasst und in den Ausgangsmultiplexdatenbitstrom 32 platziert.
Diesem folgt die Erfassung eines Wortes 34 aus dem CH2,
das aus drei 5-Bit Abtastwerten plus einem zusätzlichen Bit aus einem vierten Abtastwert
besteht, wobei dieses Wort unmittelbar dem Wort 30 in dem
multiplexierten Ausgangssignal folgt. Die Multiplexierung setzt
sich in dieser Weise durch das Wort 36 in dem n-Kanal fort,
welches wiederum aus drei 5-Bit Abtastwerten plus einem zusätzlichen
Bit aus dem vierten Abtastwert besteht. Nach der Erfassung eines
Wortes aus dem letzten Kanal wird in einem weiteren Zyklus mit einem
neuen 16-Bit Wort aus dem ersten Kanal, beginnend mit dem zweiten
Bit in dem komprimierten Abtastwert CS4 eingetreten.
-
Dem
Anschein nach bewahrt dieser Multiplexierungsprozess nicht die Integrität der komprimierten
Abtastungen für
jeden Kanal und könnte
somit erwartungsgemäß zu einem
Verlust der Eingangsaudiosignale bei der Wiedergabe führen. Aufgrund
der komplementären
Art der Wiedergabedemultiplexierung wird jedoch die Integrität der Eingangsabtastungen
vor der Dekompression wieder hergestellt.
-
Der
auf die komprimierten digitalen Eingangsaudiosignale angewendete
Kompressionsfaktor sollte groß genug
sein, um ein Multiplexieren der Signale in dieser Weise zu ermöglichen.
Erstens sollte für
Eingangsdaten mit einer größeren Anzahl
von Bits pro Abtastwert als die normale von dem digitalen Audiospeichermedium
getragene Bitdichte (wie z. B. 20 statt 16 Bits) der Kompressionsfaktor
wenigstens so groß wie
das Verhältnis
der Anzahl der Bits pro Abtastwert in den Eingangssignalen zu den
Bits pro Abtastwert, welche normalerweise in dem Speichermedium
gespeichert wird, sein. Zweitens sollte, wenn eine größere Anzahl
von Eingangssignalen vorgesehen wird, als normalerweise auf dem
Speichermedium gespeichert wird (wie z. B. eine 6-Kanal Eingangssignal
gegenüber
2-Kanal Stereo) der Kompressionsfaktor wenigstens so groß wie das
Verhältnis
der Anzahl der Eingangssignalkanäle
zu der Anzahl der Kanäle
sein, die normalerweise auf dem Speichermedium aufgezeichnet wird.
Wenn die Eingangssignale sowohl eine größere Anzahl von Bits pro Abtastwert,
als auch eine größere Anzahl
von Kanälen
aufweisen, wie normalerweise aufgezeichnet werden, sollte der Kompressionsfaktor
wenigstens gleich dem Produkt der vorstehenden zwei Verhältnisse
sein.
-
4 ist
Blockdarstellung, die darstellt, wie eine längere Aufzeichnung von Audiodaten
mit relativ geringerer Qualität,
wie z. B. 40 Stunden Einspur AM Funkaudio durchgeführt werden
kann. Die verschiedenen "Kanäle" sind in Gruppen
organisiert, die einfach gehandhabt werden können, wie z. B. fünf Gruppen
von jeweils acht Kanälen;
dieses ist in 4 so verallgemeinert, dass jede
Gruppe aus n Kanälen
besteht. Die Identifizierungsnummern 1-1 beziehen sich auf den ersten
Kanal der ersten Gruppe, 1-2 auf den zweiten Kanal der ersten Gruppe,
2-1 auf den ersten Kanal der zweiten Gruppe usw. Die Gesamtanzahl der
Gruppen ist mit m angegeben.
-
Jeder
von den Kanälen
CH1-1 bis CHm-n wird einem entsprechenden Kompressor C1-1 bis Cm-n
zugeführt.
Die Ausgangssignale jeder Gruppe der Kompressoren werden wiederum
entsprechende Datendateien DF1, DF2 ... DFn zugeführt. Jede Gruppe
der komprimierten Audioeingangssignale wird durch ihre entsprechende
Datendatei zusammengefasst und kompiliert, wobei die Ausgangssignale
aus den Datendateien durch den Multiplexer 2 multiplexiert
werden. Die weitere Verarbeitung der Eingangsaudiosignale erfolgt
wie in 1.
-
Wenn
beispielsweise 40 Stunden Audio mit AM-Qualität auf einer CD aufgezeichnet
werden sollen, die normalerweise eine Stunde 2-Kanal Stereo aufnimmt,
können
die 40 Stunden in fünf
Gruppen zu jeweils acht Kanälen
unterteilt werden, wobei die 40 Stunden unter den Kanälen in Folge
zugewiesen werden. Jede Gruppe von acht komprimierten Kanälen wird
durch eine entsprechende Datendatei zusammengefasst, wobei die Ausgangssignal
der fünf Datendateien
in ein Eingangssignal für
den AES/EBU-Formatierer
multiplexiert werden, der ein normales 16-Bit Stereosignal emuliert.
In dem Dekoderabschnitt ist eine komplementäre Datendateianordnung vorgesehen,
um die dekodierten Kanäle
1-2 bis m-n zu speichern, während
der Kanal 1-1 in das analoge Format umgewandelt und von den Lautsprechern
abgespielt wird. Während
der Stunde, welche erforderlich ist, um den Kanal 1-1 abzuspielen,
werden alle anderen Kanäle
in ihren entsprechenden Datendateien gesammelt. Jeder anschließende Kanal wird
dann aufeinanderfolgend abgespielt, bis die vollen 40 Stunden abgeschlossen
sind. Diese Wiedergabe kann jederzeit nach Wunsch unterbrochen werden.
-
Die
Verwendung einer Zwischen-Festplatten-Datendatei stellt ein großes Maß an Flexibilität bereit,
da die gleichzeitige Eingabe aller Kanäle nicht erforderlich ist.
Beispielsweise kann das System auch dazu genutzt werden, über vier
Stunden von digitales Stereoaudio aufzunehmen, indem die vier Stunden
von 2-Kanal Eingangsaudioinformation über Datenkompressoren auf eine
Zwischen-Festplatten-Datendatei aufgezeichnet werden, und dann die Signale
in das 8-Kanal Format kompiliert und dieses parallel an das AES/EBU-Format
ausgegeben wird.
-
Das
derzeit verwendete AES/EBU-Format ist in 5 dargestellt,
und wird in detaillierter in Veröffentlichungen,
wie z. B. Crystal Semiconductor Corp. Digital Audio Products Data
Book, January 1994, pages 6–35
through 6–68
diskutiert. Die AES/EBU-Daten sind in Blöcke 40 organisiert,
wobei jeder Block aus 24 Kanalstatusbytes 42 besteht. Jedes
Bytes enthält
acht Rahmen 44 und jeder Rahmen besitzt ein Paar von Subrahmen 46,
wobei jeder Subrahmen 32 Bits enthält. Die Blöcke 40 enthalten somit
384 32-Bit Subrahmen 46. Innerhalb jedes Subrahmens sind
die ersten vier Bits 0 bis 3 als ein Vorspann reserviert, die Bits
4 bis 7 für
Hilfsdaten, die Bits 8 bis 27 für
Audiodaten, das Bit 28 für
eine Validitätsanzeige,
das Bit 29 für
Benutzerdaten, das Bit 30 für
Kanalstatusdaten und das Bit 31 für ein Paritätsbit. Das Bit 29 kann zum
Codieren des aktuellen Multiplexierungsmodus verwendet werden; da
eine Gesamtsumme von 384 dieser Benutzerbits pro Block verfügbar sind,
kann praktisch jede Anzahl von Multiplexierungsmodi spezifiziert
werden.
-
Die 6A1 bis 6A7 und 6B1 bis 6B3 sind
zusammengenommen ein Schaltbild einer speziellen Ausführungsform
des in 1 dargestellten AES/EBU-Formatierers (Senders) 6.
Die nachstehend in Verbindung mit der Schaltung von 6 erwähnten Teilenummern
sind eine Industriestandardnomenklatur mit Ausnahme des Crystal
Semiconductor Corp. CS8401 AES/EBU-Senders U2 und des Crystal Semiconductor
Corporation CS8412 AES/EBU-Empfängers
U3, welcher das AES/EBU-Signal empfängt, und Taktsignale für den Sender
zu erzeugen. Die Schaltung enthält
einen 75C01 Sendepuffer FIFO U4, einen Array Logic PALCE22V10 Parallel/Seriell-Wandler
U6, ein PALCE16V8 U8 zum Senden eines DMA-Zeittaktes, ein Paar von
PALCE16V8s U10 und U12 für
die AES/EBU-Empfangs/Sende-Zeittaktung, einen PALCE22V10 Adressendecoder
U14, ein Doppel-74HCT74 U16 zum Senden einer DMA-Ablaufsteuerung,
ein Paar von 74HCT374 Steuerregistern U18 und U20, ein Paar von
74HCT244 Statusregistern U22 und U23 und einen Steckverbinder 48 zu dem
IBM-Computer.
-
Die
IBM-Datendateien 4 werden mittels DMA zum Sende-FIFO U4 übertragen.
Die Übertragung wird
durch das Signal /OUTHS, das FIFO-Halbvoll-Flag gesteuert. Die IBM-Computerbussignale /IOW,
DC, IRQ12 und DREQ0 steuern den DMA (direkten Speicherzugriff).
Der DMA wird durch Steuersignale /ENDMA03 freigegeben. Das Signal
SCK ist der serielle Schiebetakt und FSYNC ist die Rahmensynchronisation;
die nominelle FSYNC-Rate ist 44,1 KHz. Vier Bytes werden pro Zyklus
des FSYNC aus dem Ausgang des Sende-FIFO U4 an dem Parallel/Seriell-Wandler
U6 gesendet. SDATA0, das serielle Ausgangssignal von U6 wird in
den AES/EBU-Sender U2 verschoben. Der Anschluss 11 von
U2 ist der Benutzerbit-Eingang (Nr. 8 in 11),
welcher von FSYNC getaktet wird. Der Anschluss 20 von U2
ist der AES/EBU Sendeausgang. Der Digitalrekorder (Nr. 10 in 1)
ist ein beliebiger Rekorder, der in der Lage ist, AES/EBU-formatierte Daten
aufzunehmen, beispielsweise ein D3-Format-Videorekorder.
-
Eine
schematische Darstellung eines spezifischen Dekoderschaltbildes
ist in den Figuren 7A1 bis 7A7, 7B1, 7B2 und 7C1 bis 7C3 zusammengenommen
dargestellt. Der Decoder enthält
einen Crystal Semiconductor Corp. CS8412 AES/EBU-Empfänger U30;
vier PALCE16V8s U32, U34, U36, bzw. U38 zur Synchronisationsdetektion,
Detektion des Synchronisationsabstandes, Freilaufs über Synchronausfälle und
zur Stummabschaltung nach 3 ms ohne Synchronisation; sechs APTX100
4:1 Audiodekompressoren U40, U42, U44, U48, U50 und U52 von Audio
Processing Technology Inc.; der CS4328 Digital/Analog-Wandler U56,
U58 und U60 von Crystal Semiconductor Corp.; einen PALCE16V8 Interruptzeitgeber
U62 für
die Dekompressoren; einen 74HC14 Einschaltrücksetzgeber U64; einen PALCE22V10
APT Interruptgenerator U66; einen PALCE16V8 APT Ausgangssignalverzögerer U68;
einen MTO-T1-60 MHz APT DSP Takt 42; und der TL072 Zweifach-Ausgangsverstärker A2,
A4 und A6. Eine Adressierungstabelle 50 ist für die Dekompressoren U40, U42,
U44, U48, U50 und U52 angegeben.
-
Der
AES/EBU Empfänger
U30 decodiert die AES/EBU-Daten aus dem digitalen Aufzeichnungsmedium;
er führt
die Funktion des AES/EBU-Empfängers 16 in 2 aus.
Das FSYNC-Ausgangssignal ist die Rahmensynchronisation mit einer
Häufigkeit von
Eins pro Abtastwert, nominell 74,1 KHz. Das SCK-Ausgangssignal ist
der Bittakt, welcher der Verschiebetakt für den Decoder ist. Das SDATA-Ausgangssignal
liefert die seriellen Daten, welche zu der Synchronisationsdetektionsschaltung
und den Audiodekompressoren gehen. Das 11 MHz Ausgangssignal ist
das Ausgangssignal des U30 Phasenregelkreises, welcher dazu verwendet
wird, die digitale Filterung in den U56–U60 DACs zu takten. U30-14
ist das Benutzerbitausgangssignal, welches durch FSYNC getaktet
wird. U32 detektiert das Synchronisationsmuster in den seriellen
Daten; in dieser Ausführungsform
ist die Synchronisationsmarkierung ein hexadezimales $55AA im multiplexierten
Zeitschlitz 7. U32-18 ist das Synchronisationsdetektionssignal. Das
/SCK-Ausgangssignal des U32 taktet U68, welches eine Verzögerung von
einem 1/2 Bit hinzufügt, um
Ausgangssignale APDO0DEL, APDO1DEL und APDO2DEL zu erzeugen, welche
die Daten für
die DACs U56 bis U60 sind.
-
Der
Anschluss U34-18 zeigt an, dass die letzten drei Synchronisationsmarken
in korrekter Lage waren, während
das /FSYNC Ausgangssignal dazu verwendet wird zwischen ungeradzahligen
und geradzahligen Zeitschlitzen der multiplexierten Daten zu unterscheiden.
Der Anschluss U36-17, SYNC, identifiziert die Zeitschlitze für die APT
Audiodekompressoren. Er wird durch das U34-18 Signal synchronisiert.
U36-18 zeigt an, dass SYCH und U34-18 koinzident sind; diese Information
wird verwendet, um den Zähler
U38 zurückzusetzen,
welcher den Decoder stummschaltet, nachdem die Synchronisation für 3 ms nicht
empfangen worden ist. APTDI, die seriellen Eingangsdaten des Decoders
werden bei Stummschaltung auf Null gesetzt. Das /MUTE Signal setzt
die U68 Ausgänge
bei Stummschaltung auf Null.
-
Die
dekomprimierten Ausgangssignale aus den Audiodekompressoren U40,
U42, U44, U46, U48, U50 und U52 werden mit APTDO0 bis APTDO2 bezeichnet
und in Paaren multiplexiert. Die Audiodekompressor-DACs U56, U58
und U60 sind die Digital/Analog-Wandler,
die den Elementen DAC1, DAC2 ... DACn in 2 entsprechen.
Jeder von den Zweifach-Verstärkern
A2, A4 und A6 enthält
jeweils zwei Verstärker,
welche eine 6-Kanal-Ausgabefähigkeit bereitstellen.
-
Nachdem
spezielle Ausführungsformen
der Erfindung dargestellt und beschrieben wurden, werden dem Fachmann
auf diesem Gebiet zahlreiche Varianten und alternative Ausführungsformen
möglich
erscheinen. Demzufolge soll diese Erfindung lediglich hinsichtlich
der beigefügten
Ansprüche
beschränkt
sein.