DE60006953T2

DE60006953T2 - Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen

Info

Publication number: DE60006953T2
Application number: DE60006953T
Authority: DE
Inventors: Graham Peter Worthing CRAVEN; James Malcolm Upper Beeding LAW; Robert John STUART
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 1999-04-07
Filing date: 2000-04-07
Publication date: 2004-10-28
Anticipated expiration: 2020-04-08
Also published as: EP2339756A2; WO2000060746A3; EP1173925B1; KR20010113782A; CA2742649C; US6774820B2; US20050007262A1; TWI226041B; CA2365529A1; AU3828400A; MY149792A; CA2742649A1; DK1173925T3; EP2391146A3; US20040070523A1; EP1370114A2; US6611212B1; EP2339756A3; AU781629B2; SG2012056305A

Description

Gebiet der Erfindung
Diese Erfindung betrifft das Kodieren und Dekodieren digitaler Signalströme, insbesondere digitaler Audioströme mit Bezug auf die Matrixbildung von Mehrkanalsignalen.
Hintergrund der Erfindung
Verlustfreies Komprimieren ist nunmehr ein anerkanntes Mittel zum Reduzieren der zum Speichern oder Senden eines digitalen Audiosignals erforderlichen Datenrate. Eine Methode, die Datenrate eines Mehrkanalsignals zu verkleinern, besteht in der Anwendung der Matrixbildung oder Matrizierung, so daß dominante Information in einigen der übermittelten Kanäle konzentriert ist, während die anderen Kanäle verhältnismäßig wenig Information führen. Ein Zweikanal-Audiosignal kann zum Beispiel nahezu die gleiche Wellenform im linken und rechten Kanal haben, wenn ein zentrales Schallbild übermittelt wird, und in diesem Fall ist es wirksamer, die Summe und die Differenz der beiden Kanäle zu kodieren. Dieses Verfahren ist mehr im einzelnen in WO-A 96/37048 beschrieben und schließt die Verwendung einer Kaskade "primitiver Matrixquantisierer" ein, um das Matrizieren auf perfekt umkehrbare oder verlustfreie Weise zu erreichen.
Das in WO-A 96/37048 offenbarte Verfahren sieht auch die Verwendung von Matrixquantisierern vor, um auf ein ursprüngliches digitales Mehrkanalsignal eine Matrix anzuwenden, damit matrizierte digitale Signale abgeleitet werden können, die eine für allgemeines Zuhören im häuslichen Bereich besser geeignete Lautsprecherversorgung darstellen. Diese matrizierten Signale können auf einem Träger, zum Beispiel einem DVD aufgezeichnet werden, und das gewöhnliche Abspielgerät liefert dann einfach jedes matrizierte Signal an einen Lautsprecher. Mit einem fortschrittlichen Abspielgerät kann jedoch die Wirkung der Matrixquantisierer umgekehrt und damit das ursprüngliche digitale Signal genau wiederhergestellt werden, um es auf eine alternative Weise wiederzugeben.
Bei kommerzieller Anwendung von DVD-Audio ist es nötig, die beiden obigen Konzepte zu kombinieren, so daß ein Übertragungssystem, bei dem verlustfreie Kompression angewandt wird, gleichfalls sowohl ein matriziertes Signal als auch ein Originalsignal liefern kann. Bei dieser Anwendung hat das erforderliche matrizierte Signal zwei Kanäle, während das Originalsignal mehr als zwei Kanäle hat, so daß Zusatzinformation bereitgestellt werden muß, damit das Mehrkanalsignal wiedergewonnen werden kann; allerdings sollte die Zusatzinformation keinen Rechnerzusatzaufwand für Dekodierer nötig machen, mit denen nur das matrizierte Zweikanalsignal dekodiert werden soll.
Gegenwärtig wird die digitale Toninformation häufig mit 24 Bits übertragen und gängige Digitalsignalverarbeitungschips, DSP-Chips, die für Toninformation ausgelegt sind, beispielsweise die Serie Motorola 56000, werden auch leicht mit einem 24-Bit Wort fertig. Aber die in WO-A 96/37048 beschriebene Verarbeitung kann Zahlen generieren, die eine größere Wortbreite als das Originalsignal erfordern. Da die Anwendung der Berechnung mit doppelter Präzision prohibitiv teuer ist, besteht Bedarf an einem Verfahren, mit dem die Verarbeitung im wesentlichen durchgeführt werden kann, aber keine vergrößerte Wortbreite nötig ist.
Schließlich möchte auch der Verbraucher, der ein Gerät gekauft hat, das zur verlustfreien Wiedergabe ausgelegt ist, sicher sein, daß das wiederhergestellte Signal tatsächlich verlustfrei ist. Herkömmliche Paritäts- und CRC-Kontrollen innerhalb des kodierten Stroms zeigen auf Datenverfälschung beruhende Fehler innerhalb des Stroms; aber sie legen keine Fehler aufgrund der Matrixbildung oder sonstiger algorithmischer Fehlanpassung zwischen einem Kodierer und einem Dekodierer bloß.
Zusammenfassung der Erfindung
Gemäß einem ersten Aspekt der Erfindung wird ein Strom geschaffen, der in zwei Teilströme unterteilt ist, von denen der erste Teilstrom Informationen in Bezug auf ein durch Matrizieren erhaltenes "Abwärtsmischsignal" bietet und weniger Kanäle enthält als ein ursprüngliches digitales Mehrkanalsignal, und der zweite Teilstrom Zusatzinformation bietet, die es erlaubt, das ursprüngliche digitale Mehrkanalsignal mittels eines Dekodierers verlustfrei wiederzugewinnen. In dem Zusammenhang, bei dem beide Teilströme mittels verlustfreier Kompression übermittelt werden, braucht ein Dekodierer, der nur das Abwärtsmischsignal dekodiert, nur den ersten Teilstrom zu dekomprimieren und kann deshalb mit weniger Rechnerressourcen auskommen als zum Dekodieren des digitalen Mehrkanalsignals erforderlich sind.
Bei einer Variante des ersten Aspekts kann der erste Teilstrom durch eine Vielzahl von Teilströmen ersetzt sein, was die Auswahl einer Vielzahl unterschiedlicher matrizierter Darstellungen erlaubt. Wiederum enthält aber der letzte Teilstrom Zusatzinformation, die ein verlustfreies Wiederherstellen eines kompletten ursprünglichen digitalen Mehrkanalsignals ermöglicht.
Bei einer bevorzugten Verwirklichung des ersten Aspektes liefert ein Kodierer das Abwärtsmischsignal mit Hilfe einer Kaskade aus einem oder mehr primitiven Matrixquantisierern, von denen jeder ein n durch n-Matrix verwirklicht, gefolgt durch die Wahl der für das Abwärtsmischen erforderlichen m-Kanäle.
Ein Mehrkanaldekodierer nimmt die Signale von beiden Teilströmen und wendet eine Kaskade primitiver Umkehrmatrizes an, um das ursprüngliche Mehrkanalsignal wiederherzustellen. Es könnte für natürlich erachtet werden, die Kanäle, die in die Kaskade des Dekodierers eingegeben werden, so zu ordnen, daß die Kanäle vom ersten Teilstrom am Anfang plaziert werden. Das kann aber zu einer falschen Kanalreihung am Ausgang der Kaskade des Dekodierers führen, so daß vorzugsweise eine Kanalpermutation vom Kodierer spezifiziert und vom Dekodierer verwirklicht wird, um die richtige Kanalreihenfolge wiederzugewinnen.
Jeglicher Abstrich oder jegliche Rundung innerhalb der Matrixbildung sollte vorzugsweise unter Zuhilfenahme von Zittern berechnet werden. Für ein verlustfreies Kodieren muß in diesem Fall das Zittersignal dem Dekodierer bereitgestellt werden, damit dieser die vom Kodierer durchgeführten Berechnungen umkehren und folglich das ursprüngliche Signal verlustfrei wiedergewinnen kann. Das Zittern kann durch Anwendung einer "Selbstziffer-Methode" berechnet werden, wie in WO-A 96/37048 vorgesehen; im Zusammenhang mit einem verlustfreien Kompressionsschema kann aber Selbstzittern vermieden werden, wenn man im kodierten Strom einen Zitterkeim vorsieht, der es einem Dekodierer ermöglicht, seinen Zitterprozeß mit dem zu synchronisieren, der vom Kodierer angewandt wurde.
Gemäß einem zweiten Aspekt der Erfindung wird also ein verlustfreies Kompressionssystem einschließlich eines Zitterkeims im kodierten Bitstrom geschaffen. Der Zitterkeim wird zum Synchronisieren eines Pseudowillkürfolgegenerators im Dekodierer mit einem funktionell identischen Generator in einem Kodierer verwendet.
Bei einer wichtigen Anwendung der Erfindung hat das Abwärtsmischen zwei Kanäle und wird am zweckmäßigsten durch Anwenden von zwei primitiven Matrixquantisierern auf das ursprüngliche digitale Mehrkanalsignal abgeleitet. In Ausführungsbeispielen, mit denen der zweite Aspekt der Erfindung verwirklicht wird, ist für jeden Quantisierer Zittern nötig; ferner sollte unterschiedliches Zittern für die beiden Quantisierer vorgesehen werden, und die bevorzugte Wahrscheinlichkeitsverteilungsfunktion (probability distribution function – PDF) für jedes Zittern ist dreieckig. Eine wirksame Weise zum Erhalten von zwei solchen dreieckigen PDF (TPDF) Zittersignalen, die hier als "Rautenzittern" bezeichnet werden, besteht darin, zwei unabhängige rechteckige PDF (RPDF) Signale zu addieren und zu subtrahieren. Für weitere Einzelheiten und eine Verallgemeinerung auf mehr Kanäle sei verwiesen auf R. Wannamaker "Efficient Generation of Multichannel Dither Signals", AES 103rd Convention, New York, 1997, Vorabdruck Nr. 5433.
Dementsprechend arbeitet bei einer bevorzugten Verwirklichung des zweiten Aspektes der Kodierer mit einem einzigen Sequenzgenerator um zwei unabhängige RPDF-Zittersignale zu liefern, und die Summe und Differenz dieser Signale wird benutzt, um das von zwei primitiven Matrixquantisierern erforderte Zittern zu erhalten, die dazu dienen, ein Zweikanal-Abwärtsmischen abzuleiten.
In WO-A 96/37048 ist die Verwendung primitiver Matrixquantisierer innerhalb eines verlustfreien Kompressionssystems beschrieben, und vorstehend wurde auf eine bevorzugte Verwirklichung des ersten Aspektes Bezug genommen, bei dem gleichfalls primitive Matrixquantisierer angewandt werden, um die für ein Abwärtsmischsignal erforderliche Information in einen gesonderten Teilstrom zu geben.
Gemäß einem dritten Aspekt der Erfindung werden demzufolge Kodierer und Dekodierer bereitgestellt, die ungebundene primitive Matrixquantisierer enthalten, wobei der Kodierer eine Logik besitzt, die eine Abwärtsmischung akzeptiert, die als eine Matrix aus Koeffizienten spezifiziert ist, eine Anzahl primitiver Matrixquantisierer zuteilt, um die Abwärtsmischung zu liefern und wahlweise eine weitere Anzahl zum Matrizieren zuteilt, damit die Datenrate reduziert wird. Der Kodierer liefert einen Strom, der Spezifikationen der zu verwendenden primitiven Matrixquantisierer enthält und wahlweise das Hinzufügen von Zittern enthalten kann. Bei einer bevorzugten Verwirklichung wird das Zittern als zwei RPDF-Zittersequenzen erzeugt, und der Kodierer spezifiziert einen Koeffizienten für jede Zittersequenz. Rautenzittern ist so dadurch zu erhalten, daß zwei Koeffizienten mit dem gleichen Vorzeichen im Fall eines ersten primitiven Matrixquantisierers und zwei Koeffizienten mit entgegengesetzten Vorzeichen im Fall eines zweiten primitiven Matrixquantisierers bestimmt werden.
Bei einer elementaren Verwirklichung des dritten Aspektes werden die primitiven Matrizes so gewählt, daß die Abwärtsmischsignale unmittelbar im ersten Teilstrom übertragen werden. Das mag jedoch aus verschiedenen Gründen nicht optimal sein. Wenn man die n-Kanäle eines Mehrkanalteilraums so betrachtet, daß sie einen n-dimensionalen Vektorraum bestimmen, bilden die Signale, die zu einer Nichtnull-Ausgabe in einer linearen Abwärtsmischung führen, einen Teilraum. Wenn die Abwärtsmischung m-Kanäle hat, hat der Teilraum üblicherweise die Dimension m. Die Signale im ersten Teilstrom sollten dann den m-dimensionalen Teilraum optimal übermitteln, wozu es nötig sein kann, daß die übertragenen Kanäle eine matrizierte Darstellung der Abwärtsmischkanäle sind. Das bedeutet, daß die Möglichkeit zur Matrixbildung üblicherweise auch dann nötig ist, wenn ein Dekodierer lediglich zur Wiedergewinnung eines Abwärtsmischsignals ausgelegt ist.
Audiosignale werden normalerweise mit höchstens 24 Bit übermittelt, und in einem verlustfreien Wiedergabesystem, wie dem Meridian Lossless Packing (Wz) (MLP) ist sichergestellt, daß die Ausgabe 24 Bit nicht übersteigt, weil die Eingabe nicht über 24 Bit hinausging. Eine Beschreibung des MLP findet sich in "DVD Specifications for Read-Only Disc", Part 4: Audio Specifications, Packed PCM, MLP Reference Information, Version 1.0 März 1999 und in WO-A 96/37048. Im Fall der Abwärtsmischung ist das Ausgangsniveau von der Matrix im Dekodierer bestimmt. Im Prinzip könnte man die Matrixkoeffizienten so skalieren, daß die Ausgabe niemals die durch ein 24-Bit Wort bestimmte Sättigungsschwelle übersteigen kann; in der Praxis führt dies aber zu einem nicht hinnehmbar niedrigen Ausgabepegel. Außerdem ist es für den Kodierer nicht akzeptabel, die Abwärtsmischsignale zu begrenzen oder zu beschneiden, da dies nicht geschehen kann, ohne das rekonstruierte Mehrkanalsignal zu beeinträchtigen, das dann nicht verlustfrei wäre. Ein die Sättigungsschwelle übersteigendes Ausgabeniveau wird hier als "Überlastung" bezeichnet. Eine gelegentliche Überlastung des Abwärtsmischsignals wird für akzeptabel gehalten, abgesehen davon, daß eine digitale Überlastung, wenn man sie "umlaufen" ließe, höchst störend wäre. Die Konsequenz des Umlaufens wird nachfolgend mehr im einzelnen beschrieben. Bei einer bevorzugten Verwirklichung des ersten Aspektes der Erfindung besitzt deshalb ein Dekodierer, der ein Abwärtsmischsignal dekodiert, Möglichkeiten zur Beschneidung oder ähnlichen Begrenzung nach dem Berechnen der Matrix, so daß die Auswirkungen der Überlastung nicht störend werden.
Eine weitere Folge der 24-Bit Tradition bei hochqualitativer Toninformation ist die Verfügbarkeit von DSP-Verarbeitungschips mit einer internen Wortbreite von 24 Bit. Jeder primitive Matrixquantisierer, wie in WO-A 96/37048 offenbart, modifiziert einen Kanal eines Mehrkanalsignals durch Hinzufügen von Anteilen der anderen Kanäle. Ein solcher primitiver Matrixquantisierer hat einen durchgehenden Verstärkungsfaktor Eins. Die Erfindung sorgt gemäß einem vierten Aspekt für einen primitiven Matrixquantisierer, der einen Verstärkungskoeffizienten für den modifizierten Kanal akzeptiert und einen zusätzlichen Datenweg mit der Bezeichnung lsb_bypass hat. Die Verstärkung kann auf einen Wert von weniger als Eins gesetzt werden, um Überlastung zu vermeiden. Die quantisierte Ausgabe des primitiven Matrixquantisierers enthält dann weniger Information als ihre Eingabe, wobei die restliche Information in zusätzlichen niedrigstwertigen Bits (least significant bits – LSB) enthalten ist, die durch die Anwendung des Verstärkungskoeffizienten erzeugt werden. Einige oder alle dieser LSB werden dann getrennt über den lsb_bypass Datenweg übertragen. Insbesondere im Fall eines Verstärkungskoeffizienten von ±1/2 wird ein einziges LSB erzeugt, das über lsb_bypass übermittelt werden kann.
Gemäß einem fünften Aspekt der Erfindung, der ein lossless_check-Merkmal bietet, wird ein Prüfwert auf der Mehrkanaleingabe in den Kodierer berechnet und im kodierten Strom übermittelt. Der Dekodierer berechnet einen ähnlichen Prüfwert aus der dekodierten Ausgabe und vergleicht ihn mit dem innerhalb des Stroms übermittelten Prüfwert, typischerweise um dem Zuhörer eine visuelle Anzeige, beispielsweise ein Licht "verlustfrei", zu geben, daß die Wiedergabe wirklich verlustfrei ist. Im Fall eines Stroms mit einer Abwärtsmischung gemäß dem ersten Aspekt der Erfindung ist die Abwärtsmischung keine verlustfreie Reproduktion eines Originalsignals. Wenn aber ein synchronisiertes Zittern im Dekodierer gemäß dem zweiten Aspekt vorgesehen und die Matrixbildung des Dekodierers präzise beschrieben ist, wie beispielsweise die Matrixquantisierer gemäß dem dritten Aspekt der Erfindung, ist trotzdem die Abwärtsmischwiedergabe vollständig deterministisch und kann im Kodierer simuliert und einem beherrschenden Ingenieur oder Produzenten zur Probe vorgelegt werden. Der Kodierer kann also einen Prüfwert an der simulierten Abwärtsmischung berechnen, und dieses Wort kann vom Dekodierer geprüft werden, womit die verlustfreie Wiedergabe der gleichen Abwärtsmischung bestätigt wird, die der Probe unterzogen oder zur Probe verfügbar war beim Kodierprozeß.
Ein Kodierer, der beispielsweise den Vorquantisierer beinhaltet, der von P. G. Craven und J. R. Stuart in "Cascadable Lossy Data Compression Using a Lossless Kernel", J. Audio Eng. Soc., Abstracts, März 1997, Band 45, Nr. 5, S. 404, Vorabdruck Nr. 4416 beschrieben wurde, hier als "AES 1997" zitiert, und der deshalb das ursprüngliche Mehrkanalsignal vor dem Kodieren ändern kann, hat eine Wahl zur Berechnung des Prüfwertes. Wenn er den Prüfwert aus dem ursprünglichen Signal berechnet, leuchtet eine Anzeige der verlustfreien Wiedergabe, beispielsweise das Licht "verlustfrei" am Dekodierer während Passagen, die geändert wurden, nicht auf. Eine Alternative besteht darin, das geänderte Signal zur Probe als Teil des Kodierprozesses verfügbar zu machen und den Prüfwert aus dem geänderten Signal zu berechnen. Das steht in Übereinstimmung mit dem Fall des Abwärtsmischens, denn in beiden Situationen zeigt das Licht "verlustfrei" eine verlustfreie Wiedergabe eines Signals an, welches zur Probe im Kodierstadium zur Verfügung stand.
Bei einer bevorzugten Verwirklichung ist der Prüfwert ein Paritätsprüfwort, welches auf allen Kanälen berechnet wird. Bei einem den ersten Aspekt der Erfindung beinhaltenden Ausführungsbeispiel enthält der erste Teilstrom ein Paritätsprüfwort, welches aus der simulierten Abwärtsmischung errechnet wurde, ehe irgendeine Modifizierung, beispielsweise Beschneiden angewandt wird, um Überlastung zu vermeiden, während der zweite Teilstrom ein Paritätsprüfwort enthält, welches aus dem kompletten Mehrkanalsignal berechnet wurde. Ehe die Parität berechnet wird, wird das jeden Kanalwert darstellende Wort um eine Anzahl von Bits gleich der Kanalzahl gedreht, so daß eine große Wahrscheinlichkeit besteht, einen Fehler zu erkennen, der zwei Kanäle auf identische Weise betrifft.
In der gesamten vorliegenden Offenbarung wird speziell auf Kodierverfahren verwiesen, die einen kodierten Strom auf Speicherträgern, beispielsweise DVD aufzeichnen, sowie auf Dekodierverfahren, die den kodierten Strom von solchen Trägern wiedergewinnen. Es sei jedoch darauf hingewiesen, daß gemäß der Erfindung verwirklichte Kodierer auch benutzt werden können, um kodierte Ströme unter Verwendung im wesentlichen aller beliebigen Übertragungsmedien zu senden, einschließlich Basisband oder modulierter Kommunikationswege über das ganze Spektrum von Ultraschall- bis Ultraviolettfrequenzen hinweg, oder daß sie verwendet werden können, um kodierte Ströme auf Speicherträgern aufzuzeichnen, wozu im wesentlichen jede beliebige Aufzeichnungstechnik, einschließlich magnetischer und optischer Techniken, angewandt werden kann. Ähnlich können gemäß der Erfindung verwirklichte Dekodierer benutzt werden, um von solchen Trägern erhaltene kodierte Ströme zu verarbeiten.
Kurzbeschreibung der Zeichnungen
Beispiele der vorliegenden Erfindung werden nachfolgend unter Hinweis auf die beigefügten Zeichnungen beschrieben. Es zeigt:
1 eine Übersicht über einen verlustfreien Sechskanal-Kodierer, der eine Matrix aufweist, die zum Kodieren der matrizierten Kanäle in zwei Teilströme verwendet wird, die dann zu einem einzigen Strom gebündelt und auf DVD aufgezeichnet werden;
2 einen Mehrkanaldekodierer, der die beiden vom Kodierer gemäß 1 erzeugten Teilströme dekodiert, um eine verlustfreie Wiederherstellung der ursprünglichen sechs Kanäle zu liefern;
3 einen Zweikanaldekodierer, der nur den ersten Teilstrom dekodiert, um eine Zweikanalabwärtsmischung zu liefern;
4a eine Kaskade aus zwei primitiven Matrixquantisierern, die zwei Kanäle eines Vierkanalsignale modifizieren;
4b eine ähnliche Kaskade aus zwei primitiven Matrixquantisierern, die so gestaltet sind, daß sie die Verarbeitung gemäß 4a umkehren;
5a einen primitiven Matrixquantisierer mit Zittern;
5b einen primitiven Umkehrmatrixquantisierer mit Zittern;
6a einen primitiven Matrixquantisierer, der so abgewandelt ist, daß er die "LSB-Bypass"-Möglichkeit bietet sowie die getrennte Übertragung des "bypassed" im Fall einer weiteren verlustfreien Verarbeitung;
6b eine komplementäre Darstellung zu 6a, welche die getrennte Übertragung des bypassed LSB im Fall einer beliebigen verlustfreien Umkehrverarbeitung zeigt sowie einen primitiven Matrixquantisierer, der das bypassed LSB integriert und das ursprüngliche Signal wieder aufbaut;
7a ein Blockschaltbild eines Teils eines Ausführungsbeispiels eines MLP-Kodierers mit LSB bypass;
7b ein Ausführungsbeispiel eines Dekodierers, der zum Kodierer gemäß 7a komplementär ist;
8 einen primitiven Matrixquantisierer, der zur Verwendung in einem Ausführungsbeispiel eines MLP-Dekodierers spezifiziert ist;
9 einen verlustfreien Kodierer, dem ein Vorquantisierer vorausgeht mit einer Ausgabe zur Probe, sowie einen aus der vorquantisierten Ausgabe berechneten "verlustfreien Prüfwert"'
10 eine Vorrichtung zum Kodieren von Signalabtastwerten gemischter Rate mit 48 kHz und 96 kHz, die einen verlustfreien Kodierer aufweist, dem ein Aufwärtsabtaster vorausgeht.
Detaillierte Beschreibung der Erfindung
Abwärtsmischkodieren und -dekodieren
In dem Artikel "Lossless Coding for Audio Discs", J. Audio Eng. Soc. September 1996, Band 44, Nr. 9, SS. 706–720 und der internationalen Patentanmeldung WO-A 96/37048 sind einige der bei der verlustfreien Kompression angewandten Grundsätze erklärt.
Eine wichtige kommerzielle Anwendung der verlustfreien Kompression ist bei DVD-Audio, wo es zwei Klassen von Abspielgeräten gibt, den Mehrkanalspieler mit 6 Ausgängen, typischerweise zum Ansteuern einer 5.1 Lautsprecherkonfiguration, und den Zweikanalspieler mit zwei Ausgängen für Zuhörer, der zwei Lautsprecher hat oder für tragbare Verwendung mit Kopfhörern.
DVD-Audio hat also die Fähigkeit, ein aufgezeichnetes Audiosignal zweimal zu tragen, einmal als Mehrkanalsignal und wiederum als ein Zweikanalsignal. Das Signal zweimal zu tragen, hat jedoch nachteilige Auswirkungen auf die Abspielzeit. In vielen Fällen wird die ursprüngliche Aufzeichnung nur als Mehrkanalsignal dargestellt, und dem Zweikanalzuhörer wird eine Abwärtsmischung geboten, die vom Mehrkanalmeister abgeleitet ist.
Wenn das aufgezeichnete Tonsignal als herkömmliche Abtastwerte in Impulscodemodulation (Pulse Code Modulation – PCM) getragen wird, kann die Platte vorteilhafterweise die Mehrkanalaufzeichnung plus Abwärtsmischkoeffizienten tragen, die es dem Abspielgerät erlauben, eine Zweikanalabwärtsmischung als eine lineare Kombination der Kanäle der Mehrkanalsignale abzuleiten. Ein Abwärtsgemisch aus den beiden Kanälen L₀ und R₀ könnte zum Beispiel gemäß der unten folgenden Matrixgleichung aus einem Mehrkanalsignal berechnet werden, das die Kanäle links vorn, rechts vorn, links rundum, rechts rundum, Mitte und niederfrequente Effekte umfaßt, die mit L_f, R_f, L_s, R_s, C bzw. L_fe bezeichnet sind.
Die Berechnung der Abwärtsmischung innerhalb des Plattenspielers ist allerdings weniger attraktiv bei Verwendung der verlustfreien Kompression. Alle sechs Kanäle des Mehrkanalsignals müssen dekodiert werden, ehe die obige Matrixgleichung anwendbar wäre, und in diesem Zusammenhang ist der rechnerische Zusatzaufwand für das Dekodieren von sechs Kanälen übermäßig groß.
Ein Beispiel, dieses Problem zu lösen, ist in den 1, 2 und 3 gezeigt. In 1 wird das dem Kodierer dargestellte Mehrkanalsignal Matrix 1 zugeführt, in diesem Fall einer 6 × 6 Matrix, deren Ausgänge m₀ ... m₅ in zwei Teilsätze {m₀, m₁} und {m₂, m₃, m₄, m₅} aufgeteilt sind. Diese Teilsätze werden dann von Kodiererkern 0 und Kodiererkern 1 zu zwei getrennten Teilströmen kodiert, die als Teilstrom 0 und Teilstrom 1 bezeichnet sind. Jeder Teilstrom wird dann durch einen FIFO-Puffer geleitet, und die Teilströme werden in dem Paketierer kombiniert, um einen zusammengesetzten Ausgangsstrom zu erzeugen, der auf einem Träger, wie DVD vorhanden sein kann, wie in der Figur gezeigt. Der Grund für die Verwendung eines FIFO-Puffers ist im US Patent 6 023 233 erörtert und von M. A. Gerzon, P. G. Craven, J. R. Stuart, M. J. Law und R. J. Wilson in "The MLP Lossless Compression System" veranschaulicht worden, wie bei der AES 17th International Conference on High Quality Audio Coding, in Florenz, September 1998 vorgetragen, hier als AES 1998 zitiert.
Um das von dem in 1 gezeigten Kodierer kodierte Mehrkanalsignal zu spielen, wird ein Dekodierer verwendet, wie er in 2 gezeigt ist. In diesem Dekodierer empfängt ein Entpaketierer einen kodierten Strom von einem Übertragungsträger oder Speicherträger, beispielsweise DVD, wie gezeigt, zerlegt den kodierten Strom und teilt ihn in zwei Teilströme auf. Jeder Teilstrom wird durch einen FIFO-Puffer und einen Dekodiererkern geleitet, um die Signale m₀ ... m₅ zu liefern. Diese Signale werden dann durch die Umkehr der Matrix 1 geleitet, um das ursprüngliche Mehrkanalsignal zu liefern.
Um ein Zweikanalabwärtsgemisch zu spielen, wird ein Dekodierer wie der in 3 gezeigte benutzt. Hier werden die Teilströme getrennt, aber nur der Teilstrom 0 wird beibehalten, gepuffert und dekodiert, um Signale m₀ und m₁ zu liefern. Von diesen leitet die Matrix 0 die gewünschten Signale L₀ und R₀ ab, wobei davon ausgegangen wird, daß der Kodierer die richtige Information in m₀ und m₁ gepackt hat, damit dies möglich ist. Wenn zum Beispiel die beiden oberen Reihen der Matrix 1 im Kodierer der 1 Abwärtsmischkoeffizienten, wie die in der oben gezeigten 2 × 6 Matrix enthalten, handelt es sich bei den Signalen m₀ und m₁ um die erforderlichen Abwärtsmischsignale L₀ und R₀. In diesem Fall ist die Matrix 0 in 3 redundant und kann entweder durch die Identitätsmatrix ersetzt oder weggelassen werden.
Ein Unterscheidungsmerkmal der vorliegenden Erfindung ist es, daß es durchgehend verlustfrei sein kann, so daß das Mehrkanalausgangssignal vom Dekodierer gemäß 2 Bit für Bit identisch ist mit dem Eingangssignal, welches der Kodierer in 1 erhält. Falls vorhanden, muß also der Kodierer- und Dekodiererkern verlustfrei sein, und die Matrix 1 und ihre Umkehr müssen gleichfalls verlustfrei sein. Die verlustfreien Kodierer- und Dekodiererkerne können im wesentlichen auf beliebige Weise verwirklicht sein, sofern verlustfreies Kodieren geboten ist; aber in bevorzugten Ausführungsbeispielen werden diese Prozesse gemäß den Prozessen verwirklicht, die in WO-A 96/37048 offenbart sind. Überlegungen zur Verwirklichung der Matrix 1 werden nachfolgend mehr im einzelnen beschrieben.
Das herausragende Merkmal der verlustfreien Kodierung erlaubt es einem DVD oder sonstigen Träger, einen kodierten Strom in einer Form zu übermitteln, der eine verlustfreie Wiedergewinnung eines ursprünglichen Mehrkanalsignals erlaubt und außerdem eine einfache Wiedergewinnung einer matrizierten Darstellung oder Abwärtsmischung des ursprünglichen Signals unter Verwendung im wesentlichen des gleichen Speicherraums oder der gleichen Bandbreite wie sie sonst nötig wäre, um nur das ursprüngliche Mehrkanalsignal zu übermitteln. In Ausführungsbeispielen in der Praxis kann der erforderliche Speicherraum oder die erforderliche Bandbreite eines verlustfrei komprimierten Signals, welches eine Abwärtsmischung beinhaltet, sehr geringfügig größer sein als der für das komprimierte Mehrkanalsignal allein benötigte, wegen der im kodierten Strom übermittelten Zusatzinformation, die der Dekodierer braucht, um die Abwärtsmischung umzukehren, und aufgrund der Tatsache, daß die zum Kodieren der Abwärtsmischung verwendeten PMQ nicht zur Verfügung stehen, um den Kodierprozeß zu optimieren.
Eine Methode zum verlustfreien Matrizieren besteht in der Verwendung einer Kaskade aus primitiven Matrixquantisierern (PMQ), die als primitive Matrizes in WO-A 96/37048 offenbart sind. Diese PMQ sind Matrizes, die unter Verwendung von Signalwerten aus anderen Kanälen zum Modifizieren des Signals in einem Kanal benutzt werden, und zwar auf eine Weise, die umkehrbar ist. Insbesondere beschreibt WO-A 96/37048 wie eine verlustfreie Umkehrmatrizierung dadurch durchgeführt werden kann, daß die Wirkung jedes Quantisierers in umgekehrter Reihenfolge umgekehrt wird. Das ist in 4a veranschaulicht, wo zwei PMQ in Kaskade zur Verwendung in einem Kodierer gezeigt sind, und in 4b, welche die beiden Umkehr-PMQ in umgekehrter Reihenfolge zeigt. In einfachen Fällen, wo es insbesondere nur zwei primitive Matrixquantisierer gibt, können die Signale S1, S2, S3 und S4 mit zwei Originalkanälen, beispielsweise L_f, R_f, L₅, R₅ usw. identifiziert werden, und die modifizierten Signale S1' und S2' können mit L₀ und R₀ oder mit den Signalen m₀ und m₁ identifiziert werden.
Zum Verifizieren der Bit-für-Bit Wiederherstellung des ursprünglichen Signals ist anzumerken, daß dem Quantisierer Q₂ in 4b das gleiche Signal zugeführt wird wie dem Quantisierer Q₂ in 4a. Unter der Annahme, daß diese identisch sind, erzeugen sie folglich die gleiche Ausgabe q₂. In 4a ist das Signal S2' als S2' = S2 – q₂ gebildet, während 4b, die Wiederherstellung S2 = S2' + q₂ durchführt. Wenn S2 wiederhergestellt ist, wird dem Quantisierer Q₁ in 4b das gleiche Signal zugeführt wie dem Quantisierer Q₁ in 4a, und das Signal S1 in ähnlicher Weise wiederhergestellt wie das Signal S2.
Die Quantisierer Q₁ und Q₂ sind nötig, um zu verhindern, daß die Wortlänge der modifizierten Signale S1' und S2' die der Eingangssignale S1 und S2 überschreitet, so daß der Informationsinhalt nicht vergrößert wird.
4 zeigt aus Gründen der Einfachheit lediglich vier Kanäle, aber es ist ersichtlich, wie dieses Prinzip auf eine beliebige Anzahl von Kanälen erweitert werden kann, und wie eine größere Anzahl PMQ in Kaskade verwendet werden kann. Jeder PMQ modifiziert nur einen Audiokanal, und in 4 werden nur die beiden ersten Kanäle modifiziert. In der Praxis können irgendwelche der Kanäle oder sämtliche modifiziert werden, und es besteht keine Einschränkung hinsichtlich der Reihenfolge, noch ein Verbot, einen gegebenen Kanal mehr als einmal zu modifizieren. Im Fall einer Zweikanalabwärtsmischung wäre es normal, mindestens die beiden ersten Kanäle zu modifizieren.
Es ist ersichtlich, daß jeder PMQ in 4 einen Verstärkungsfaktor Eins zu dem Kanal hat, den er modifiziert. Es ist nicht möglich, die allgemeinste Matrix von einer Kaskade solcher PMQ zu synthetisieren; in WO-A 96/37048 ist erklärt, daß der Satz auf Matrizes beschränkt ist, die eine Determinante gleich Eins haben. Im allgemeinen Fall ist es nötig, die Abwärtsmischgleichungen zu skalieren, um eine Determinante zu erhalten, die eine Einheitsgröße hat. Im Fall der oben schon gezeigten Abwärtsmischgleichungen sollten diese zum Beispiel um 4/3 skaliert werden, so daß die Matrix 1 im Kodierer folgendes verwirklicht:
während die Matrix 0 im Zweikanaldekodierer die umgekehrte Skalierung verwirklicht:
Es ist klar, daß die Matrix 0 nicht als eine Kaskade von PMQ verwirklicht werden kann, weil ihre Determinante keine Einheitsgröße hat. Das ist aber kein Problem, da die Matrix 0 nicht nötig ist für die verlustfreie Wiederherstellung eines ursprünglichen Signals. 8 zeigt eine Architektur, die weiter unten näher erläutert wird, und die es einem Zweikanaldekodierer ermöglicht, die Matrix 0 entweder als eine strenge Kaskade von PMQ zur verlustfreien Dekodierung eines ursprünglichen Zweikanalsignals oder als eine mehr allgemeine Matrix für Abwärtsmischanwendungen zu verwirklichen.
Um die Koeffizienten für die die Matrix 0 bildenden PMQ zu berechnen, kann folgendes Verfahren angewandt werden. Die Matrix der Abwärtsmischkoeffizienten wird beispielsweise in dem oben erwogenen Fall mit "downmix" bezeichnet, dann ergibt sich
Dann wird für j = 1 ... 6 berechnet:
Dann wird berechnet
und dann wird für j = 3 ... 6 berechnet:
Die Koeffizienten m_coeff in 4a und 4b für ij sind nun gegeben durch den Ausdruck m_coeff[i, j] = –coeffi,j wo das Minuszeichen wegen der Subtraktion in 4a entsteht.
Im Mehrkanaldekodierer der 2 kann die Umkehrmatrix 1 wie in 4b verwirklicht werden, wobei die gleichen Werte m_coeff[i, j] wie beim Kodierer, aber mit der umgekehrten Reihenfolge der PMQ und dem Ersatz jeder Subtraktion in jedem kodierenden PMQ durch eine Addition verwendet werden, wie gezeigt. Es sei erwähnt, daß die Eingaben m₀ ... m₅ in die Kaskade der PMQ in diesem Fall von zwei Teilströmen abgeleitet sind.
Auch wenn die bisher beschriebene Erfindung besonders relevant ist im Zusammenhang mit der Kompression, ist sie doch allgemein anwendbar und nicht auf Kompressionssysteme beschränkt. Außerdem ist der oben beschriebene Grundsatz nicht auf die zwei Teilströme beschränkt. Bei Verwendung von drei Teilströmen kann zum Beispiel ein Neunkanalsignal verlustfrei übermittelt werden, wobei die zum Dekodieren einer Sechskanalabwärtsmischung benötigte Information in den beiden ersten Teilströmen getragen ist und die Information für das Dekodieren einer Zweikanalabwärtsmischung (als lineare Kombination der sechs Kanäle) nur im ersten Teilstrom getragen ist.
In gegenwärtigen kommerziellen Anwendungen multiplizieren insgesamt in der die Abwärtsmischsignale L₀ und R₀ definierenden Matrix hinsichtlich L_f, R_f, L_s, R_s, C und L_fe die größten Koeffizienten L_f und R_f, wie im Fall des obigen Beispiels. Diese Situation kann aber nicht garantiert werden, da die dominanten Koeffizienten unter Umständen einige der anderen Signale multiplizieren. Wenn die Koeffizienten von L_f und R_f tatsächlich klein sind, entsteht ein Problem aufgrund des Erfordernisses, daß ein PMQ eine Einheitsverstärkung für den Kanal haben muß, den er modifiziert, weil ein oder mehr weitere Kanäle entsprechend aufwärtsskaliert sein sollten. Bei Anwendung eines oben gezeigten einfachen Skalierens, um dieses Problem zu lösen, werden andere Koeffizienten der Matrix die Einheit überschreiten, und folglich eine Überlastung oder sonstige Schwierigkeiten entstehen.
Dieses Problem kann mit einer Permutation der Kanäle im Kodierer angegangen werden, so daß zum Beispiel ein erster Kanal, dessen Koeffizient in L₀ am größten ist, an den Anfang einer Folge gebracht würde, und ein zweiter Kanal, dessen Koeffizient in R₀ am größten ist, an die zweite Stelle gegeben wird. In diesem Beispiel wird angenommen, daß der erste Kanal und der zweite Kanal nicht derselbe sind. Diese Umordnung macht es normalerweise dem Kodierer möglich, matrizierte Signale m₀ und m₁ zu liefern, die zu L₀ und R₀ proportional sind, indem zwei PMQ benutzt werden, deren Koeffizienten nicht wesentlich über Eins hinausgehen, um die beiden ersten Kanäle zu modifizieren.
Bei einer derartigen Permutation im Kodierer ist im Mehrkanaldekodierer gemäß 2 eine Umkehrpermutation nötig, um die Signale in der richtigen Reihenfolge wiederherzustellen. Eine Neuabbildung der Ausgangskanäle wird in einem MLP-Dekodierer gemäß Anweisung durch die ch_assign Information im kodierten Strom geboten. Wenn der Kodierer eine Permutation anwendet, kann er den Dekodierer anweisen, eine Umkehrpermutation anzuwenden, indem er die richtige Neuabbildung spezifiziert.
Die Umkehrpermutation wird angewandt nach dem Matrizieren des Dekodierers, wenn der Kodierer vor dem Matrizieren eine Permutation anwendet. Eine andere Möglichkeit wäre es, die Permutation im Dekodierer vor dem Matrizieren anzuwenden, wenn im Kodierer nach dem Matrizieren eine Permutation angewandt wird. Darüber hinaus wäre es möglich, daß ein Dekodierer eines MLP-Stroms die Permutation vor dem Matrizieren anwendet, wenn die Koeffizienten der Matrix auch permutiert sind.
Es gibt gewisse unwahrscheinliche, aber doch mögliche Abwärtsmischspezifikationen, die die oben umrissenen Strategien nicht handhaben können. Eine Möglichkeit besteht darin, daß L₀ und R₀ Koeffizienten haben können, die die gleichen oder nahezu die gleichen sind oder, anders ausgedrückt, die Abwärtsmischung mono oder nahezu mono ist. In dieser Situation ist das obige Verfahren nicht zufriedenstellend, weil der Denominator des Ausdrucks für coeff_2,1 Null oder nahezu Null wird, was zu großen Koeffizienten und einer hohen Wahrscheinlichkeit einer Überlastung führt. Dieses Problem kann gelöst werden durch unterschiedliche Wahl für m₀ und m₁. Wenn man die Signale als Elemente eines Vektorraums betrachtet, reicht die Spanne der Signale L₀ und R₀ im allgemeinen über einen zweidimensionalen Teilraum des sechsdimensionalen Euklidischen Vektorraums oder insgesamt eines n-dimensionalen Euklidischen Vektorraums, dessen Kanäle des Mehrkanalsignals eine orthonormale Basis bilden. Die Reichweite der Signale m₀ und m₁ muß über diesen Teilraum gehen, wenn L₀ und R₀ wiederhergestellt werden sollen. Es ist vernünftig, m₀ und m₀ orthogonal oder nahezu orthogonal zueinander in dem Teilraum zu wählen, über den die Spannweite von L₀ und R₀ reicht. Nach der Bestimmung von m₀, ausgedrückt als Eingangskanäle, können diese Kanäle vor der Matrix permutiert werden, so daß ein Kanal, dessen Koeffizient in m₀ am größten ist oder im wesentlichen am größten, als erstes kommt. Dann wird ein PMQ berechnet, so daß der als erstes gesendete Kanal eine skalierte Version des gewünschten m₀ ist. Dann ist es nötig, einen PMQ zu berechnen, um eine skalierte Version von m₁ zu erhalten. Es kann wiederum eine vorherige Permutation wünschenswert sein, um die Größe der Koeffizienten auf ein Minimum einzuschränken. Diese Permutation der zu matrizierenden Signale ist dem Prozeß verwandt, der dem Fachmann für Matrixberechnungen als "partial pivoting" bekannt ist und hier nicht näher beschrieben wird. Anfangs kann m₀ und m₁ eine willkürliche Skalierung gegeben werden. Dann kann das obige Verfahren zur Bestimmung der Koeffizienten benutzt werden, indem die Matrix downmix durch die Matrix ersetzt wird, die m₀ und m₁, ausgedrückt als die ursprünglichen Kanäle, wiedergibt. Die durch dieses Verfahren festgelegten Koeffizienten bestimmen dann die tatsächliche Skalierung von m₀ und m₁.
Im dem Fall der Degenerierung, bei der L₀ und R₀ identische Signale oder skalierte Versionen voneinander sind, ist der Teilraum, über den L₀ und R₀ hinweg reichen, eindimensional. In diesem Fall kann m₀ willkürlich innerhalb des Teilraums gewählt werden, und m₁ kann orthogonal zu m₀, aber von außerhalb des Teilraums gewählt werden. Die Matrix 0 in einem Zweikanaldekodierer stellt dann L₀ und R₀ als eine skalierte Version von m₀ wieder her und ignoriert m₁.
In dem MLP-System verlustfreier Kompression werden die Koeffizienten der Matrix 0 im ersten Teilstrom geführt. Der Teilstrom 0 und die Koeffizienten der Matrix 1 werden vollständig im zweiten Teilstrom geführt, dem Teilstrom 1, auch wenn einige dieser Koeffizienten zum Multiplizieren von aus dem ersten Teilstrom dekodierten Signalen verwendet werden.
Abwärtsmischkodieren kombiniert mit Reduktion der Datenrate
Matrixbildung anwendende, verlustfreie Kodierer sind ausführlich in WO-A 96/37048 beschrieben, wo der Zweck der Matrizierung darin besteht, die Korrelation zwischen den übertragenen Kanälen zu verringern, um dadurch die übertragene Datenrate zu verringern. Wenn ein Abwärtsmischen kodiert werden soll, wie oben beschrieben, ist das Matrizieren teilweise durch die Notwendigkeit des Abwärtsmischens spezifiziert, aber es bleibt noch beträchtlicher Freiraum in der Spezifikation übrig.
Zunächst erlaubt die Bedingung bei der Wahl von m₀ und m₁, daß sie etwa orthogonal sein müssen, immer noch, eine willkürliche Rotation innerhalb des Teilraums unter L₀ und R₀ vorzunehmen. Diese Freiheit kann dazu verwendet werden, die zum Kodieren des ersten Teilstroms, beispielsweise des Teilstroms 0 erforderliche Datenrate auf ein Minimum einzuschränken und dazu die in WO-A 96/37048 beschriebenen Verfahren anzuwenden, mit denen die von einem beliebigen Signal von zwei oder mehr Kanälen genommene Datenrate auf ein Minimum gesenkt wird.
Zweitens bleibt bei einem Mehrkanalsignal mit sechs Kanälen als Ausgangsbeispiel die Matrizierung der vier Kanäle, die nicht modifiziert werden, um das Abwärtsgemisch zu liefern, immer noch vollständig unspezifiziert. Wiederum können die in WO-A 96/37048 beschriebenen Verfahren angewandt werden, um die zum Kodieren des zweiten Teilstroms, Teilstrom 1, erforderliche Datenrate auf ein Minimum zu senken. Im Fall einer PMQ-Verwirklichung können zwei PMQ verwendet werden, um die Abwärtsmischung abzuleiten, und jeglicher übrig bleibende PMQ kann herangezogen werden, um die Datenrate der übrigen vier Kanäle in der gleichen Weise wie für irgendein anderes Vierkanalsignal zu minimieren. Im MLP-Kompressionssystem stehen insgesamt sechs PMQ zur Verfügung, was es möglich macht, dieser Aufgabe vier zuzuteilen.
Zittern
In audiophilen Kreisen wird es gegenwärtig für außerordentlich wichtig erachtet, daß jegliche Quantisierung, die einen Einfluß auf die Wiedergabe des Tonsignals hat, unter Zuhilfenahme von Zittern durchgeführt wird. Es ist üblich, dem Signal, ehe es dem Quantisierer zugeleitet wird, einen kleinen pseudowillkürlichen Zitterwert hinzuzufügen. Siehe zum Beispiel S. P. Lipshitz, R. A. Wannamaker und J. Vanderkooy, "Quantization and Dither: A Theoretical Survey," J. Audio Eng. Soc., Mai 1992, Band 40, SS. 355–375.
Die primitiven Matrixquantisierer führen von Natur aus eine Quantisierung durch. Im Fall der verlustfreien Kodierung und Dekodierung ist das Fehlen von Zittern kein Problem, weil das verlustfreie Matrizieren im Dekodierer genau die vom Kodierer durchgeführte Matrizierung umkehrt, einschließlich jeglicher Quantisierungseffekte. Aber wenn eine Abwärtsmischung geliefert wird, wie vorstehend beschrieben, wird von der Matrix 0 der Effekt der Matrix 1 nicht umgekehrt, und die Abwärtsmischung enthält Quantisierungseffekte von beiden Matrizes.
Um die Abwärtsmischquantisierung gutartig zu machen, muß von beiden Matrizes Zittern hinzugefügt werden. Das Hinzufügen von Zittern in der Matrix 1 des Kodierers hat aber Einfluß auf das übertragene Signal, und das Dekodieren des Mehrkanalsignals wird dadurch beeinträchtigt. Deshalb muß zum verlustfreien Dekodieren die Umkehrmatrix 1 im Mehrkanaldekodierer die Auswirkung des Zitterns im Matrizieren des Kodierers ausgleichen.
Die 5a und 5b zeigen ein komplementäres Paar primitiver Matrixquantisierer einschließlich Zittern, im vorliegenden Fall für ein Dreikanalsignal. Die beiden Matrixquantisierer unterscheiden sich nur darin, daß das Signal q₁ in dem in 5a gezeigten Quantisierer subtrahiert wird, während das gleiche Signal in dem in 5b gezeigten Quantisierer hinzugefügt wird. Damit ist leicht zu erkennen, daß unter der Voraussetzung, daß das von dem "dither" markierten Kasten gelieferte Signal in beiden Fällen gleich ist, die Tätigkeit des PMQ in 5a vom PMQ in 5b rückgängig gemacht wird. So kann ein Kodierer, wie er in 1 gezeigt ist, aufgebaut werden, bei dem Matrix 1 eine Kaskade aus PMQ wie in 5a gezeigt ist, und der Mehrkanaldekodierer gemäß 2 kann mit einer Umkehrmatrix 1 aufgebaut werden, die eine Kaskade aus PMQ in umgekehrter Reihenfolge ist, wie in 5b gezeigt. Damit ist sichergestellt, daß das Mehrkanalsignal verlustfrei wiederhergestellt wird.
Um die beste Qualität der Abwärtsmischwiedergabe zu erhalten, sollten die herkömmlichen Erfordernisse hinsichtlich des Zitterns sowohl in der Matrix 1 des Kodierers als auch in der Matrix 0 des Dekodierers erfüllt sein. Im Kodierer beispielsweise könnte der in 5a und 5b gezeigte Zittergenerator vorteilhafterweise TPDF-Zittern mit einer Amplitude von Spitze zu Spitze gleich zwei Quantisierungsschritten des Quantisierers Q liefern. Wenn die beiden ersten PMQ im Kodierer das Abwärtsmischsignal liefern, ist es nicht nötig, den späteren PMQ Zittern hinzuzufügen.
Die Matrix 0 kann eine andere Art von Matrix sein, umfaßt aber in jedem Fall eine Berechnung, womit die Wortlänge vergrößert wird, gefolgt durch die Quantisierung, und es ist normal, vor jeder Quantisierung Zittern hinzuzufügen.
Die Notwendigkeit, in den Kodier- und Dekodierquantisierern gemäß 5a und 5b identisches Zittern vorzusehen, kann dadurch erfüllt werden, daß der Kodierer einen den Zustand eines Pseudowillkürfolgegenerators übermittelnden Keim innerhalb des Stroms von Zeit zu Zeit aufzeichnet und der Dekodierer den Keim liest und dadurch seinen eigenen Folgegenerator synchronisiert.
Im Fall von MLP ist der Folgegenerator ein 23-Bit kreisförmiges Schieberegister, welches eine pseudowillkürliche binäre Sequenz (PRBS) unter Verwendung des Ausdrucks b23 ⊕ b5 ⊕ 1erzeugt, worin b_x das Bit x des Schieberegisters und ⊕ die Operation "exclusive-OR" darstellt.
Der Keim im Strom ist also 23 Bit lang. Das Schieberegister wird pro Abtastperiode um 16 Bit verschoben. Das macht es möglich, für jeden Signalabtastwert eine neue 16-Bit Pseudowillkürzahl mit einer rechteckigen PDF zu erzeugen. Da aber ein TPDF-Zittern bevorzugt wird, sind die 16 Bit in zwei 8-Bit Zitterabtastwerte aufgeteilt. Diese 8-Bit Abtastwerte haben jeweils eine rechteckige PDF, aber der Kodierer hat die Wahl, diese beiden Abtastwerte zu addieren und zu subtrahieren, um zwei weitere nicht korrelierte Zitterabtastwerte mit einer dreieckigen PDF zu liefern. Dieser Prozeß ist als Rautenzittern bekannt und in der oben genannten Veröffentlichung von Wannamaker, AES Vorab druck Nr. 4533, erläutert. Der Kodierer kann diese beiden dreieckigen PDF-Abtastwerte benutzen, um zwei, das Abwärtsmischsignal liefernden PMQ Zittern hinzuzufügen.
Audiophile Erwägungen machen es nicht nötig, das in der Matrix 0 zur Wiedergewinnung des Abwärtsmischsignals aufgebrachte Zittern mit einem entsprechenden Prozeß im Kodierer zu synchronisieren. Im Gegenteil, es ist sogar unerwünscht, das gleiche Zittern anzuwenden, oder daß die Matrix 0 irgendein beliebiges Zittern anwendet, das mit dem in der Matrix 1 angewandten Zittern korreliert ist. Beim MLP erzeugt der Abwärtsmischdekodierer ein Zittersignal unter Verwendung des gleichen Algorithmus wie der Mehrkanaldekodierer; aber das Zittern ist anders, weil der Keim anders ist. Der Keim für das Zitern der Matrix 0 wird im Teilstrom 0 getragen, während der Keim für das Zittern der Matrix 1 im Teilstrom 1 getragen ist.
Im Fall von MLP ist die Quantisierung und Arithmetik der Matrix 0 ebenso exakt spezifiziert wie für die Matrix 1, und da auch das Zittern vom Kodierer gesteuert wird, hat der Kodierer exakte Kenntnis der vom Dekodierer wiedergewonnenen Signale L₀ und R₀, bis herab zum letzten Bit. Hierauf wird später noch zurückzukommen sein.
Sättigung der Abwärtsmischung
Häufig wird es für kommerziell wichtig gehalten, ein Tonsignal auf dem höchstmöglichen Pegel zu kodieren, den der digitale Kanal handhaben kann. Bei "live" Musik können Spitzen sehr unkontrolliert sein, und der Durchschnittspegel muß gut unterhalb der digitalen Beschneidung gehalten werden, wenn keine Spitze eines "live" Signals eine Überlastung verursachen soll. Aber der professionelle Aufzeichnungsingenieur ist mit Werkzeugen für die Wellenformmodifikation gut ausgestattet, beispielsweise mit Beschneidungs- und Begrenzungsinstrumenten, die es ihm erlauben, ein kontrolliertes Signal zu erzeugen, welches einen Kanal sehr vollständig moduliert und dabei gleichzeitig sicherstellt, daß keine Spitze zu Überlastung führt.
Es ist ersichtlich, daß eine digitale Überlastung zu äußerst unangenehmen Artefakten führen kann, die durch "Umlauf"-Wirkungen verursacht werden. Im herkömmlichen 2er-Komplement 24-Bit Tonsignal ist beispielsweise der maximale positive Wert durch 7fffff hexadezimal wiedergegeben. Ein naiver Versuch, diesen Wert um eine Quantisierungsstufe zu erhöhen, führt zu 800000 hexadezimal, was als maximale negative Auslenkung interpretiert wird. Kleine Überlastungen erzeugen also Übergänge über die gesamte Skala, die einen großen hochfrequenten Energiegehalt haben, was außerordentlich unangenehm klingt und oft das Durchbrennen von Hochtönern verursacht.
Im Zusammenhang mit der DVD-Mastererstellung wird davon ausgegangen, daß ein gesteuerter Mehrkanal-Master produziert und für die verlustfreie Kodierung bereitgestellt wird. Mit anderen Worten, es wird davon ausgegangen, daß irgendwelche Überlastprobleme bei der Herstellung des Mehrkanalsignals bereits erledigt wurden. Es bleibt also Aufgabe, eine akzeptable L₀R₀ Abwärtsmischung hervorzubringen.
Eine Überlastung am Ausgang des in 3 gezeigten Zweikanaldekodierers kann vermieden werden, wenn die Koeffizienten der Matrix 0 genug abwärts skaliert werden. Dieses Abwärtsskalieren bringt aber zwei Schwierigkeiten mit sich. Zunächst einmal ist das erforderliche Ausmaß der Skalierung nicht bekannt, bis das gesamte Programmaterial geprüft worden ist, was auf der Stufe der Mastererzeugung unbequem ist. Zweitens führt ein derartiges Skalieren wahrscheinlich zu einer Abwärtsmischung, die gemäß wirtschaftlicher Normen unannehmbar ruhig ist. Das liegt daran, daß vorhergehendes Beschneiden oder Begrenzen des Mehrkanalsignals nicht notwendigerweise wirksam ist, das Verhältnis von Spitze zu Durchschnitt einer vom Mehrkanalsignal abgeleiteten Abwärtsmischung einzuschränken.
Es ist nicht möglich, die Abwärtsmischung auf der Kodierstufe einzustellen, denn das würde zu einer Änderung der Übertragung von m₀ und m₁ führen, und die Wiederherstellung des Mehrkanalsignals könnte dann nicht verlustfrei sein.
Dementsprechend wird mit der Erfindung dafür gesorgt, daß ein Abwärtsmischdekodierer die Fähigkeit besitzt, intern ein Abwärtsmischsignal zu erzeugen, dessen Amplitude größer ist als ein digitaler Ausgang handhaben kann, und einen Begrenzer oder Beschneider vor der endgültigen Ausgabe einzubauen, so daß eine Überlastung des Abwärtsmischsignals ohne unangenehme Auswirkungen behandelt wird.
Beim MLP ist die Ausgangswortbreite auf 24 Bit festgelegt, und die meisten der interen Signalwege, einschließlich der Wege zwischen den PMQ sind gleichfalls als 24 Bit breit spezifiziert. Aber nach dem letzten PMQ im Dekodierer ist ein Verschieber vorgesehen, der links oder rechts um eine variable Zahl von Bits verschiebt, die von "output_shift"-Information bestimmt ist, welche von Zeit zu Zeit im kodierten Strom getragen ist. Wenn der Kodierer eine Eingabe und eine Abwärtsmischspezifikation erhält, die zu einer Abwärtsmischung führen, für die mehr als 24 Bit erforderlich sind, wird die Abwärtsmischspezifikation vom Kodierer abwärts skaliert, um eine Überlastung innerhalb der Matrixbildung zu vermeiden. Das Abwärtsskalieren geschieht um eine Zweierpotenz, so daß die richtige Amplitude im Dekodierer dadurch wiederhergestellt werden kann, daß eine positive Linksverschiebung in der "output_shift"-Information vorgeschrieben wird. Der Verschieber im Dekodierer erzeugt also ein Abwärtsmischsignal der richtigen Amplitude, und das kann dann für die 24-Bitausgabe zu groß sein. Deshalb ist zwischen dem Shifter und dem Ausgang ein Beschneider angeordnet, um die vorstehend erwähnte, unerwünschte Umlaufwirkung zu vermeiden. Es ist zweckmäßig, den Beschneider unter Zuhilfenahme der in vielen DSP-Chips vorhandenen Möglichkeit zu verwirklichen, gemäß der ein Wert in einem Akkumulator mittels Sättigungsarithmetik in einen Speicher eingespeichert werden kann.
Zusätzliche Synergie ergibt sich in diesem Fall, wenn der Speicherort, an dem der Akkumulator gespeichert wird, in Abhängigkeit von der "ch_assign"-Information im Strom berechnet werden kann. Damit wird eine Umkehrpermutation von Kanälen bewirkt, die in einem Dekodierer erforderlich ist, ohne daß hier ein gesonderter Vorgang vorgesehen werden muß.
LSB-Bypass
Wenn ein Eingabesignal den vollen 24-Bit Bereich ausnutzt, besteht die Wahrscheinlichkeit, daß ein Versuch zur Modifizierung eines Kanals mittels eines PMQ gemäß 4 oder 5 zu einem Signal führt, welches den 24-Bit Bereich übersteigt. Dieser vergrößerte Bereich, der beim verlustfreien Kodier- und Dekodierverfahren intern bleibt, kann wirtschaftlich sogar von einem Prozessor mit 24-Bit Arithmetik hingenommen werden, wenn die Architektur gemäß 6 benutzt wird.
6a zeigt links einen PMQ mit eingebautem Verschieber. Es wird davon ausgegangen, daß die Signalwege insgesamt eine Breite von 24 Bit haben; aber nach der Subtraktion des quantisierten Signals q von S1 steht ein 25-Bit Datenweg zur Verfügung, um Platz für die Addition zu schaffen. Das Signal wird dann artithmetisch nach rechts um ein Bit verschoben, und das vom Boden des Wortes verschobene LSB wird getrennt von der Hauptausgabe S1' ausgegeben, die die übrigen Bit bis zur Höhe von 24 enthält.
Das so herausgeschobene LSB muß natürlich mit dem Signal geführt werden. Um die Signale S1, S2 und S3 zu dekodieren, sollte das LSB zusammen mit den Signalen S1', S2 und S3 dem rechts in 6b gezeigten Umkehr-PMQ zugestellt werden. Hier wird das LSB an S1' angehängt und das Ergebnis um ein Bit nach links verschoben, so daß das gesondert getragene LSB das LSB des verschobenen Wortes ist, wodurch ein 25-Bit Signal entsteht, zu dem das quantisierte Signal q summiert ist. Wegen der verlustfreien Wiederherstellung des Signals S1, welches als Eingabe in den PMQ in 6a eingegeben wurde, ist das Additionsergebnis unter der Vorausetzung, daß S1 ein 24-Bit Signal ist, nur 24 Bit breit.
Wie in 6a rechts und in 6b links gezeigt, ist es möglich, zwischen den beiden komplementären PMQ eine weitere verlustfreie Verarbeitung und eine umgekehrte verlustfreie Verarbeitung des 24 Bit breiten Weges einzufügen, vorausgesetzt es gibt einen Umgehungsweg, so daß das LSB gesondert übermittelt wird. Ein Teilblockschaltbild eines MLP-Kodierers ist beispielsweise in 7a und ein entsprechender Dekodierer in 7b gezeigt. Nach der in 7a gezeigten Matrix kommt ein Dekorrelator und ein Entropiekodierer, so daß bei diesem Beispiel das in 6a gezeigte verlustfreie Verarbeiten diese Posten einschließen würde. Unter Hinweis auf 7b könnte ähnlich das in 6b gezeigte umgekehrte verlustfreie Verarbeiten einen Entropiedekodierer und einen Rekorrelator umfassen. Wie aus 7a und 7b hervorgeht, ist dafür gesorgt, daß über diese Verarbeitung hinweg das auf den Umweg geschickte LSB erhalten bleibt, daß es in den kodierten Strom oder Teilstrom gespeichert und aus diesem wiedergewonnen wird.
Manchmal verursacht die Matrixbildung beim MLP keine Überlastung; aber der Dekorrelator, der zwar insgesamt dazu bestimmt ist, die Signalamplitude zu verkleinern, vergrößert diese an bestimmten Abtastwerten und wirkt damit einem Überlastproblem entgegen. In diesem Fall kann ein PMQ des in 6a gezeigten Typs verwendet werden, um die Amplitude des Signals zu verkleinern und damit etwa 6 dB Platz für weitere Verarbeitung schaffen. Die in 6 gezeigten Koeffizienten können auf Null gesetzt werden, wenn ein PMQ für diesen Zweck allein benutzt wird.
Es ist klar, daß das Schema gemäß 6a verallgemeinert werden könnte, um mehr als ein Bit aus einem PMQ heraus zu verschieben und als Umgehungssignal zu übertragen. Das geschieht nicht im Fall vom MLP.
Die in 6a gezeigte Verarbeitung ist verlustfrei, und auch die entsprechende umgekehrte verlustfreie Verarbeitung in 6b ist verlustfrei. Das macht es möglich, diese Verarbeitung zu verschachteln. So könnte beispielsweise das rechts in 6a gezeigte verlustfreie Verarbeiten einen PMQ der links in 6a gezeigten Art umfassen, und die Kodierwirkung dieses verschachtelten PMQ könnte dadurch umgekehrt werden, daß in die links in 6a gezeigte, umgekehrte verlustfreie Verarbeitung ein PMQ von der rechts in 6b dargestellten Art eingefügt wird. In diesem Fall würde auf jeder Stufe ein umgangenes LSB erzeugt, so daß zwei umgangene LSB um jedes weitere Verarbeiten herum geführt werden müssen.
In einem MLP-Kodierer gibt es bis zu sechs PMQ in Kaskadenanordnung, und irgendwelche derselben oder alle können so gestaltet sein, daß sie ein umgangenes LSB bereitstellen. So kann der Teilstrom bis zu sechs umgangene LSB, eins von jedem PMQ, führen. Auch wenn jedes umgangene LSB von einem anderen PMQ stammt, müssen sie nicht von unterschiedlichen Kanälen kommen, und der Kodierer kann gelegentlich sogar beschließen, zwei oder mehr derartiger PMQ einem Kanal zuzuordnen und damit zusätzliche 12 dB oder mehr Platz für diesen Kanal gewinnen.
Es gibt Varianten der in 6a und 6b gezeigten Topologie, die eine gleichwertige Wirkung haben. Die Subtraktion des Signals q in 6a und die Addition des Signals q in 6b könnten ausgetauscht werden. Eine Subtraktion kann vermieden werden durch Umkehr des Vorzeichens der Koeffizienten, durch Umkehr des Vorzeichens des Zitterns, falls angewandt, und, wenn nötig, durch die Vornahme einer Einstellung am Quantisierer Q, beispielsweise durch einen Austausch eines Quantisierers, der abrundet, durch einen Quantisierer, der aufrundet. Eine weitere Variation besteht darin, den Quantisierer Q im Vorwärtsweg anzuordnen, wie in 23a von WO-A 96/37048 gezeigt, statt in der Seitenkette, wobei wiederum bei der Wahl von Quantisierern, die aufrunden oder abrunden, Sorgfalt angewandt wird. In 6b kann, statt das Signal S1' und LSB zusammen zu verschieben, auch eine Verschiebung des Signals S1' nach links vorgenommen werden, wodurch ein LSB von Null entsteht, und dann kann das getrennt übermittelte LSB hinzugefügt werden. In diesem Fall kann die Addition des getrennt übermittelten LSB mit der Addition des quantisierten Signals q kombiniert oder nach dieser vorgenommen werden. In Ausführungsbeispielen für MLP sollte die Addition eine 24-Bit Zahl hervorbringen.
8 zeigt den für MLP spezifizierten Dekodierer-PMQ, der so gestaltet ist, daß er drei Kanäle S1, S2 und S3 wiederherstellt, wobei der zweite Kanal S2 modifiziert wird. Das umfaßt einige der oben erörterten Variationen und sieht zusätzlich eine allgemeine Multiplikation vor, um die Linksverschiebung zu verwirklichen. Der Kodierer spezifiziert die Koeffizientenwerte und schließt sie in den Strom ein. Um das Signal S2' um ein Bit nach links zu verschieben, könnte der Kodierer den Koeffizienten m_coeff[2,2] auf +2 setzen. Bei MLP werden 16-Bit Koeffizienten im Bereich [–2, +2) benutzt, so daß der genaue Wert +2 nicht verfügbar ist und der Kodierer statt dessen –2 spezifiziert. Daher invertiert der Dekodier-PMQ in diesem Fall das Signal, und auch der Kodierer muß zum Ausgleich das Signal invertieren.
Wie schon gesagt, ist es vorteilhaft, zwei nicht korrelierte RPDF-Zittersignale zu haben, um durch Addition und Subtraktion zwei TPDF-Zittersignale zu liefern. Beim MLP-Matrizieren werden die beiden 8-Bit RPDF-Zittersignale, die vom Folgegenerator erhalten werden, auf 24 Bit zeichenerweitert und so behandelt, als ob sie zwei zusätzliche Kanäle wären. Diese Zitterkanäle werden niemals von PMQ modifiziert. Das Zittern in 8 ist wie folgt gegeben: m_coeff[2,4] Dither 0 + m_coeff[2,5] Dither 1
Das Zittern ist so wie das als Zittern in 6b identifizierte Zittern. Wenn m_coeff[2,4] und m_coeff[2,5] die gleiche Größe haben, hat das Zittern die gewünschte dreieckige PDF. Bei Verwendung von zwei PMQ, die eine Abwärtsmischung liefern, spezifiziert also der Kodierer m_coeff[2,4] und m_coeff[2,5] mit dem gleichen Vorzeichen in einem PMQ und mit entgegengesetzten Vorzeichen im anderen PMQ, so daß unkorrelierte TPDF-Zittersignale durch das oben beschriebene Rautenzitter-Verfahren hervorgebracht werden.
Wenn man in 8 die Eingabesignalabtastwerte als 24-Bit ganze Zahlen betrachtet, haben die Ausgangswerte von den Multiplizierern insgesamt 14 Bit nach dem binären Punkt, weil die Koeffizienten m_coeff[2,j] bis zu 14 Bit nach dem binären Punkt haben können. Für den Moment sei angenommen, daß der Quantisierer Q_ss einen 24-Bit ganzzahligen Wert quantisiert. Wenn in diesem Fall die beiden 8-Bit RPDF-Zitterwerte in den 24-Bit Wörtern Dither 0 und Dither 1 rechtsbündig gemacht werden, sind die korrekten Größen für m_coeff[2,4] und m_coeff[2,5] beide 2^–8.
Wenn zum Verringern der Bitrate des Stroms ohne Beeinflussung der Abwärtsmischsignale zusätzliche PMQ verwendet werden, ist es im Kodierer normal, kein Zittern anzuwenden, und infolgedessen sind die m_coeff[i,j] Werte, die zum Multiplizieren der Zitterkanäle in den PMQ benutzt werden, Null. Das läßt vermuten, daß man eine Einsparung machen kann, wenn man die Möglichkeit des Zitterns nicht in allen PMQ vorsieht. Diese Einsparung wird allerdings im Fall von MLP nicht gemacht, da die aus der Regelmäßigkeit der Struktur in praktischen Ausführungsbeispielen erzielten Vorteile die Kosten eines zusätzlichen Multiplikationspaares weit überwiegen.
Bei MLP werden die PMQ in Kaskadenanordnung entsprechend 8 sowohl für Matrix 0 als auch für Matrix 1 verwendet. Im Fall von Matrix 1 wäre es normal, daß der Koeffizient des Kanals, der modifiziert wird, im dargestellten Fall m_coeff[2,2], den Wert –2 hat, wenn die LSB-Umgehung benutzt wird, und entweder +1 oder –1, wenn die LSB-Umgehung nicht benutzt wird. Diese Wahl wird vom Kodierer getroffen, und der Koeffizient wird in den Strom eingeschlossen, um vom Dekodierer benutzt zu werden.
Bei Verwendung des Zweikanaldekodierers zur Wiederherstellung einer Abwärtsmischung sorgt die Matrix 0 für das Matrizieren und/oder Skalieren der Signale m₀ und m₁ zur Schaffung von L₀ und R₀. Dann sind in den PMQ allgemeine Koeffizienten, nicht beschränkt auf Zweierpotenzen, erforderlich. Wiederum sind die Regelmäßigkeit im Dekodierer und die Flexibilität für den Kodierer Gründe, um einheitlich die Architektur gemäß 8 zu wählen.
In der Matrix 0 kann das Skalieren des modifizierten Kanals durch Skalieren aller Koeffizienten, mit Ausnahme der Zitterkoeffizienten, die dazu beitragen, erreicht werden. Wenn ein Aufwärtsskalieren erforderlich ist, besteht die Möglichkeit, daß das nötige Skalieren den verfügbaren Koeffizientenbereich von [–2,2] überschreitet, oder daß eine Signalüberlastung innerhalb der Matrixbildung auftritt. Dem kann begegnet werden durch Reduzieren der Skalierung um eine Zweierpotenz und anschließende Anwendung des abschließenden "output_shift" zum Wiederherstellen des gewünschten Pegels.
Bei MLP mit Abwärtsmischung ist es nicht normal, die umgangenen LSB im ersten Teilstrom, dem Teilstrom 0, zu führen, da der Abwärtsmischdekodierer sich nicht um eine verlustfreie Wiedergabe bemüht. Der zweite Teilstrom, Teilstrom 1, trägt alle für das Matrizieren des Mehrkanaldekodierers nötigen Informationen, einschließlich der Koeffizienten, des Zitterkeims und der umgangenen LSB, einschließlich jener LSB, die aus den Kanälen ausgeschieden wurden, welche im Teilstrom 0 geführt werden.
Ein Merkmal aus 8, das keinen Einfluß auf die obige Beschreibung hat, ist die Tatsache, daß der Quantisierer Q_ss imstande ist, auf eine Stufengröße zu quantisieren, die eine Zweierpotenz ist, wodurch die Abbruchstelle um ein oder mehr Bit oberhalb des LSB zu liegen kommt. Diese Fähigkeit ist zur Optimierung der Behandlung von Eingabesignalen eingeschlossen, die nicht das oder die niedrigstwertigen Bit des 24-Bit Wortes praktizieren. Bei MLP wird das Merkmal der LSB-Umgehung nur benutzt, wenn die Quantisierungsschrittgröße auf Eins gesetzt ist.
Stromintegrität und Verlustfrei-Prüfung
Ein verlustbehaftetes Kodiersystem liefert insgesamt eine Ausgabe, bei der es sich nicht um eine genaue Wiederherstellung des eingegebenen Signals handelt. Ein Prüfen der Integrität, zum Beispiel eine zyklische Redundanzprüfung (CRC) oder eine Paritätsprüfung, sollte auf das Prüfen des kodierten Stroms beschränkt sein, so daß Übertragungsfehler markiert werden können. Das Verhältnis zwischen dem Eingabesignal und seiner abschließenden Wiederherstellung ist ein bißchen unbekannt, da es sowohl von inhärenten Verlusten beim verlustbehafteten Kodier- und Dekodierprozeß beeinflußt ist, als auch durch mit der Plattform in Beziehung stehende Fehler, die dadurch verursacht werden, daß sich das arithmetische Verhalten des Dekodierprozessors möglicherweise von dem des Kodierprozessors unterscheidet.
Beim MLP wird für jedes Segment des Eingabesignals ein Paritätswort, bekannt als Verlustfreiprüfwert errechnet und in den kodierten Strom eingeschlossen. Es wird erwartet, daß ein Dekodierer ein ähnliches Paritätswort berechnet und anzeigt, daß ein Fehler aufgetreten ist, wenn dieses berechnete Wort nicht mit dem im Strom eingeschlossenen Wort übereinstimmt. Anders als bei den Prüfungen in einem verlustbehafteten Kodiersystem können mit den Prüfungen in einem verlustfreien Kodiersystem Ausfälle gezeigt werden, die auf Überlastung oder sonstiges algorithmisches Versagen innerhalb des Algorithmus, mit der Plattform in Beziehung stehende Unstimmigkeiten und Übertragungsfehler zurückgehen.
Im Fall bevorzugter Ausführungsbeispiele kann ein Abspielgerät dem Benutzer über solche Fehler Auskunft geben. So könnte zum Beispiel ein Licht "verlustfrei" aufleuchten, wenn die beiden Prüfwörter übereinstimmen, und ansonsten ausgeschaltet sein. Da ein Ausfall kurzfristig sein könnte, kann eine Impulsstreckschaltung verwendet werden, um dem Benutzer Zeit zu geben, das Versagen zu bemerken. Beispielsweise könnte bei Empfang eines einzigen Versagens das Licht während zwei Sekunden aus bleiben.
Bei MLP ist der Verlustfreiprüfwert ein 8-Bit Paritätswort, das für alle Kanäle und alle Abtastwerte innerhalb eines Segmentes von typischerweise 1280 Wörtern berechnet wird. Was die MLP-Spezifikation betrifft, umfaßt dieses Segment alle Abtastwerte zwischen zwei aufeinanderfolgenden "Restart Points". Da MLP von 24-Bit Wörtern ausgeht, würde die Parität natürlich als ein 24-Bit Wort berechnet, aber dieses Paritätswort ist in drei Oktette oder Byte unterteilt, und diese werden zusammen "exclusively-ORed", um den Verlustfreiprüfwert zu liefern. Ehe die Parität berechnet wird, wird jedes 24-Bit Signalwort um eine Bitanzahl gedreht, die der Kanalzahl entspricht. Durch diese Rotation wird ein Problem vermieden, bei dem ein Fehler, der zwei Kanäle identisch beeinflußt, ansonsten unerfaßt bliebe.
Gemäß einer Alternative wird die Parität aller Oktette innerhalb jedes Segmentes jedes Kanals benutzt, um ein 8-Bit Paritätsoktett zu erzeugen, und jedes Paritätsoktett wird um seine Kanalzahl gedreht, ehe sie zusammen "exclusively-ORed" werden. Das ist unter Umständen wirtschaftlicher im Fall von Prozessoren, die keine 24-Bit Wortlänge haben.
Bei MLP mit einem einzigen Teilstrom bezieht sich der Verlustfreiprüfwert auf das ursprüngliche Signal, welches verlustfrei wiederhergestellt wird. Wenn MLP eine Abwärtsmischung trägt, trägt der zweite Teilstrom den Verlustfreiprüfwert, der sich auf das ursprüngliche Signal bezieht, und das wird von einem Mehrkanaldekodierer geprüft.
Im Fall mit Abwärtsmischung trägt der erste Teilstrom auch einen Verlustfreiprüfwert; dieser bezieht sich aber nur auf die Abwärtsmischung. Auch wenn die ausgegebene Abwärtsmischung keine verlustfreie Wiedergabe eines ursprünglichen Signals ist, ist sie doch bestimmbar aufgrund der präzisen Spezifikation der Quantisierungen in der Matrix 0 und der präzisen Spezifikation des Zitterns. Deshalb kann ein Kodierer die Abwärtsmischung bestimmen, die von einem Dekodierer wiederhergestellt wird, und kann den Verlustfreiprüfwert anhand dieser simulierten Abwärtsmischung berechnen. Im Zusammenhang mit der Schaffung eines DVD-Audio-Masters ist beabsichtigt, daß der Kodierer die simulierte Abwärtsmischung zur Probe verfügbar macht, so daß dem Zuhörer versichert werden kann, daß das von seinem Abspielgerät wiederhergestellte Signal Bit für Bit identisch ist mit dem Signal, welches der Master-Ingenieur oder der Produzent der Aufzeichnung gehört hat.
Eine Ausnahme ergibt sich im Fall einer Überlastung, die, wie oben erwähnt, normalerweise durch Beschneiden oder Begrenzen im Abspielgerät gehandhabt wird. Da das Verhalten des Beschneidens oder Begrenzens nicht genau festgelegt ist, wird der Verlustfreiprüfwert aus dem Signal unmittelbar vor jeglicher Sättigung oder Begrenzung berechnet. Bei MLP, wo, wie schon gesagt, der Dekodierer einen Verschieber nach dem letzten PMQ beinhaltet und das Beschneiden dadurch verwirklichen kann, daß er einen Akkumulator in den Speicher unter Anwendung von Sättigungsarithmetik einspeichert, kann die Verlustfreiprüfung unmittelbar aus dem Wert im Akkumulator berechnet werden, worauf die Sättigung folglich keinen Einfluß hat.
Manchmal kann, wie 9 zeigt, einem verlustfreien Kodierer ein Vorquantisierer vorausgehen, um die übertragene Datenrate zu verkleinern. Weitere Information hinsichtlich der Vorquantisierung ist aus AES 1997 und AES 1998, den oben genannten Veröffentlichungen, zu entnehmen. Unter diesen Umständen ist die Wiedergabe des vom Vorquantisierer empfangenen, ursprünglichen Signals nicht verlustfrei, aber die Wiedergabe des vorquantisierten Signals ist verlustfrei. Wiederum sollte das vorquantisierte Signal zur Probe bereitgestellt werden, und der Verlustfreiprüfwert sollte aus dem vorquantisierten Signal berechnet werden, damit dem Zuhörer versichert werden kann, daß das von seinem Abspielgerät wiedergewonnene Signal Bit für Bit identisch mit dem Signal ist, welches im Stadium der Schaffung des Masters zur Probe angehört oder mindestens zur Probe verfügbar war.
Strategien zur Wahl der Kodierermatrix
Um eine Zweikanalabwärtsmischung zu kodieren, müssen die Signale m₀ und m₁ in dem Teilraum sein, den die Abwärtsmischkanäle L₀ und R₀ umfassen. Innerhalb dieses Kriteriums ist zwar die Flexibilität beträchtlich, aber einige Wahlmöglichkeiten sind besser als andere. So sollte der Kodierer aus verschiedenen Gründen vermeiden, m₀ und m₁ so zu wählen, daß sie nahezu linear abhängig sind. Erstens hätte die Matrix 0 dann wahrscheinlich große Koeffizienten, und die Wiederherstellung aus dem Abwärtsgemisch wäre rauschbehaftet. Zweitens würde der Kodierer beim Lösen der Gleichungen, um die in der Matrix 1 enthaltenen PMQ zu bestimmen, vermutlich Koeffizienten erzeugen, die größer wären als der zulässige Bereich. Drittens beeinträchtigt das Matrizieren der Signale die Datenrate für die verlustfreie Kompression und ist wenig wirksam zum getrennten Übertragen von Signalen, die einander sehr ähnlich sind.
Wie schon erwähnt, besteht eine Möglichkeit zur Vermeidung der schlimmsten dieser Probleme darin, m₀ und m₁ so zu wählen, daß sie zueinander orthogonal sind. Das bedeutet, daß m₀ und m₁, ausgehend von den Eingabesignalen, von einer Matrix bestimmt sind, deren Reihen orthogonal zueinander sind. Bei diesem Kriterium verbleibt noch ein wenig Flexibilität, die beispielsweise so gelöst werden könnte, daß m₀ proportional zu L₀ gewählt würde. Es sei zum Beispiel die folgende Abwärtsmischspezifikation betrachtet:
Hier ist der größte, zu L₀ beitragende Koeffizient der von L_f, der einen Wert von 0.75 hat. Wenn also m₀ = L₀ generiert wird, ergibt sich, skaliert um 1/0.75 = 1.333
was mit einem PMQ verwirklicht werden kann, der den ersten Kanal unmodifiziert läßt.
Das Signal m-1 muß eine lineare Kombination aus L₀ und R₀ sein. Eine lineare Kombination, die orthogonal zu L₀ und folglich auch orthogonal zu m₀ ist, ergibt sich durch m1(unscaled) = R0 – λL0,wobei
und das Symbol bezeichnet das skalare oder Punktprodukt von zwei Vektoren.
Der resultierende Wert ist gleichwertig zur Hernahme der Punktprodukte der Reihenvektoren in der Abwärtsmischmatrix. Wenn man zum Bezeichnen der Abwärtsmischmatrix downmix nimmt, kann das skalare λ wie folgt ausgedrückt werden
worin downmix₁ den ersten Reihenvektor der Matrix und
downmix₂ den zweiten Reihenvektor der Matrix bezeichnet und bei Anwendung der Abwärtsmischmatrix aus dem oben gezeigten Beispiel: λ = 0.1849. Deshalb
Der m₁ generierende zweite PMQ empfängt die vom ersten PMQ bereitgestellten Signale, deren erster Kanal m₀ statt L_f ist. Deshalb muß m₁, was m₀, R_f usw. betrifft, neu ausgedrückt werden.
Hier multipliziert 0.8000, der größte Koeffizient, R_s, den vierten Eingangskanal. Aus diesem Grund wird eine Permutation angewandt, wie schon gesagt, um den zweiten und vierten Eingangskanal auszutauschen und dadurch R_s an die zweite Stelle zu bringen, so daß m₁ in der Matrixausgabe an zweiter Stelle erscheint.
Schließlich wird so skaliert, daß der Koeffizient von R_s Eins ist.
Das ist jetzt die korrekte Form für die Verwirklichung mittels eines zweiten PMQ.
Das obige Beispiel zeigt nur eine von mehreren Strategien, die ein Kodierer verfolgen kann. Eine einfachere Strategie besteht darin, m₀ wie vorstehend zu berechnen, dann m₁, abgesehen vom Skalieren, durch Subtrahieren eines Anteils 1 von L₀ von R₀ zu bestimmen, so daß der Koeffizient von L_f Null ist. Bei diesem speziellen Beispiel hat die Spärlichkeit der ursprünglichen Abwärtsmischspezifikation zur Folge, daß diese Bedingung mit λ = 0 erfüllt ist.
Der Wert Null des ersten Koeffizienten macht es unnötig, beim Berechnen des zweiten PMQ die Auswirkung des ersten PMQ zu berücksichtigen. Mit anderen Worten, m₀ kann benutzt werden, um in der obigen Gleichung L-f zu ersetzen, ohne daß eine weitere Änderung gemacht wird. Wenn, wie schon gesagt, skaliert und permuttiert wird, ist folgendes zu erhalten:
Das hat die richtige Form zur Verwirklichung mit dem zweiten PMQ.
Zwar wird mit dem obigen vereinfachten Verfahren keine Orthogonalität erreicht, aber es wird vermieden, daß m₀ und m₁ erzeugt werden, die nahezu linear abhängig sind, wenn zum Beispiel L₀ und R₀ selbst fast linear abhängig wären. Die Möglichkeit, daß L₀ und R₀ tatsächlich linear abhängig sind (das heißt skalierte Versionen voneinander sind), muß geprüft und als ein Sonderfall behandelt werden.
Als Alternative kann in einem fortschrittlicheren Kodierer die obige Bedingung der Orthogonalität durch die Bedingung ersetzt werden, daß die Kreuzkorrelation der Signale m₀ und m₁ ungefähr Null sein sollte. Diese Bedingung läßt sich durch eine geeignete Wahl von λ erfüllen. Die Bedingung der Kreuzkorrelation Null minimiert die Energie in m₁, und bei Fehlen einer Frequenzabhängigkeit hätte dies die Wirkung, die übertragene Datenrate auf ein Minimum einzuschränken. Wie in der Veröffentlichung WO-A 96/37048 beschrieben, ist die Datenrate bei Vorhandensein einer spektralen Variation stärker vom Informationsgehalt als von der Energie abhängig. Bei typischen Tonsignalen wird die Energie und Kreuzkorrelation von großen niederfrequenten Signalen dominiert, die wegen ihrer geringen Bandbreite nur wenig Informationsinhalt haben. Deshalb ist es besser, eine spektrale Gewichtung, die typischerweise hohe Frequenzen hervorhebt, vorzunehmen, ehe die Kreuzkorrelation berechnet wird. Ideal ist es, die spektrale Gewichtung an das Signal selbst anzupassen; aber es ist kompliziert, eine optimale oder nahezu optimale Gewichtung festzulegen, und in der Praxis reicht eine festgelegte Gewichtung aus. Ein digitaler Filter, dessen z-Transformation (1 – z–1 )2 ist, hat zum Beispiel einen Frequenzgang, der mit 12 dB pro Oktave über den niedrigen und mittleren Frequenzteil des Tonfrequenzbandes ansteigt, und das reicht im allgemeinen aus, um eine unmäßige Beherrschung durch große niederfrequente Signale zu unterdrücken.
Laut Offenbarung in WO-A 96/37048 sind die bevorzugten Richtungen der übertragenen Signale die Eigenvektoren einer Matrix, die bei fehlender Frequenzabhängigkeit die Korrelationsmatrix der Signale wären. Eine solche Wahl würde zu einer Null-Korrelation zwischen den übertragenen Signalen führen. Aber die Berechnung von Eigenvektoren ist zeitraubend, und das oben umrissene Verfahren, bei dem die Null-Korrelation einfach durch Subtraktion erhalten wird, bringt eine Datenrate hervor, die sich theoretisch nur wenig von der unterscheidet, die das Resultat einer Eigenvektorberechnung ist.
Das obige Verfahren zur Wahl der Richtungen der übermittelten Signale kann auch allgemein angewandt werden, das heißt auf Kodierer, die keine Abwärtsmischung berechnen, oder auch auf die Verarbeitung der verbleibenden Kanäle, sobald eine Abwärtsmischung extrahiert wurde.
Es wird nun ein Verfahren beschrieben, bei dem die Vektorrichtungen der übertragenen Kanäle einzeln der Reihe nach gewählt werden. Es wird ein erster Eingangskanal gewählt, und weitere Kanäle werden davon subtrahiert mit Koeffizienten, die so gewählt sind, daß die Energie in dem nach der Subtraktion verbleibenden Signal minimal ist. Die Subtraktion wird von einem primitiven Matrixquantisierer durchgeführt, der ein Ausgangssignal liefert. Dann wird ein weiterer Eingangskanal gewählt, und wiederum werden die übrigen Kanäle mittels eines PMQ subtrahiert. Der PMQ liefert das nächste Ausgangssignal, und seine Koeffizienten sind so gewählt, daß die Energie darin auf ein Minimum begrenzt ist. Das Verfahren wird wiederholt, bis alle Eingangskanäle verarbeitet oder alle verfügbaren PMQ benutzt wurden oder bis entschieden wird, daß es sich nicht lohnt, weitere Matrixtransformationen vorzunehmen. Jegliche weiteren Eingangskanäle, die nicht mittels PMQ modifiziert wurden, werden dann ohne Modifikation zum Ausgang weitergeleitet.
Eine Verbesserung dieses Verfahrens bestünde darin, die Subtraktion so zu wählen, daß ein Maß an Entropie oder Informationsgehalt des Signals statt der Energie allein minimiert wird. Gemäß WO-A 96/37048 wurde die Entropie geschätzt, indem das Integral über der Frequenz des Logarithmus des Spektrums genommen wurde, und es wäre absolut möglich, jede Minimierung im Hinblick auf dieses Kriterium zu berechnen. Das Minimieren spektral gewichteter Energie wäre eine weniger rechenintensive Alternative, und es gibt verschiedene Wege, eine angemessene spektrale Gewichtung in Abhängigkeit vom Signal zu berechnen. Noch wirtschaftlicher wäre es, eine Gewichtung mit fester Frequenz vorzunehmen, wie beispielsweise von einem digitalen Filter mit z-Transformation geboten (1 – z^–1)².
Für den Fachmann auf dem Gebiet der numerischen Matrixalgebra ist erkennbar, daß das obige Verfahren der Anwendung der Gram-Schmidt-Orthogonalisierung zur Schaffung eines orthogonalen Vektorsatzes etwas verwandt ist. Bei Betrachtung der Subtraktion könnte man es per Analogie für unnötig halten, Vektoren einzuschließen, die bereits verarbeitet wurden, denn diese sind kraft ihrer Konstruktion orthogonal zu den noch nicht verarbeiteten Vektoren. Das ist jedoch nicht allgemeingültig, wenn eine Abwärtsmischung kodiert wird, und es trifft auch nicht zu, wenn die Minimierung die Entropie statt die Energie betrifft. Insgesamt wird also jeder PMQ beide Signale, die bereits verarbeitet wurden, und Eingangskanäle, die noch verarbeitet werden müssen, subtrahieren.
Die Reihenfolge, in der Kanäle zur Modifizierung gewählt werden, ist bisher als willkürlich erachtet worden. Die Reihenfolge kann in vielen Fällen tatsächlich geringe Auswirkung auf die endgültige Datenrate haben, sie kann aber die Größe der Koeffizienten bei der Subtraktion wesentlich beeinflussen. Da MLP die Koeffizienten auf einen maximalen Wert von 2 einschränkt, ist dies eine wichtige Überlegung. Wenn die Minimierung die Energie betrifft oder Energie mit fester spektraler Gewichtung, ist dies rechenmäßig extrem schnell, und daher ist es absolut möglich, eine willkürliche Auswahl auf Versuchsbasis zu treffen und sie zu verwerfen, und eine andere zu versuchen, wenn die Koeffizienten zu groß sind. Eine weitere Heuristik besteht darin, einen Kanal zur Modifikation auszuwählen, dessen Energie oder spektral gewichtete Energie am kleinsten ist.
Wenn der PMQ so verwirklicht wird, wie in 8 gezeigt, wäre es normal, einen Koeffizienten von +1 oder –1 für den zu modifizierenden Kanal zu wählen. Wenn mit der Subtraktion Signale erzeugt werden, die Überlastung hervorrufen, kann der Koeffizient verkleinert werden. Es wäre bei MLP normal, ihn bis auf –0.5 zu verkleinern, wozu das oben beschriebene LSB-Umgehungsverfahren angewandt wird. Hiermit wird ein zusätzlicher Raum von 6 dB geschaffen, der normalerweise ausreicht. Ist das nicht der Fall, gibt es verschiedene Möglichkeiten. Die gegenwärtig betrachtete Matrixtransformation kann abgewandelt oder aufgegeben werden, was bedeutet, daß der Eingangskanal ohne Modifikation übermittelt werden kann. Oder für den Fall, daß ein weiterer PMQ verfügbar ist, kann auch dieser zur LSB-Umgehungsoperation ausgelegt und dem in Betracht gezogenen Kanal zugeordnet werden, was eine weitere Vergrößerung des Kopfraums um 6 dB ermöglicht. Der zusätzliche PMQ tritt vor dem PMQ in Aktion, der die Subtraktion verwirklicht. Da der zusätzliche PMQ allein zum Verkleinern der Signalamplitude nötig ist, wendet er bei MLP normalerweise einen Koeffizienten von –0.5 auf den zu modifizierenden Kanal an und hat ansonsten Null-Koeffizienten.
Ein Sonderfall, bei dem zwei oder sogar drei PMQ zum Verarbeiten eines Kanals erforderlich sein können, ist der Fall, bei dem eine Abwärtsmischspezifikation mehrere Koeffizienten von im wesentlichen der gleichen Größe hat. Obgleich zum Beispiel alle Koeffizienten bei dem PMQ, der in dem obigen Beispiel m₀ liefert, weniger sind als Eins, ist die Summe absoluter Größen der Koeffizienten 2.627. Selbst wenn also der m₀ liefernde PMQ mit LSB-Umgehung arbeitet und den Kanal um 0.5 skaliert, besteht immer noch die Möglichkeit einer Zunahme der Signalgröße um einen Faktor 1.313. Das kann bei einer gegebenen Abtastperiode dann passieren, wenn die Kanäle der Eingabe gleichzeitig volle Modulation erreichen und jeder das gleiche Vorzeichen wie sein Koeffizient im PMQ hat oder wenn jeder das entgegengesetzte Vorzeichen wie sein Koeffizient hat. Eine Überlastung kann durch Zuteilung eines zusätzlichen PMQ vermieden werden, der vor dem PMQ, der m₀ liefert, einen LSB-Bypass verwirklicht.
Aus Gründen der Klarheit sind in der vorstehenden Beschreibung nur die PMQ erwähnt, die der Kodierer verwirklicht. Es liegt auf der Hand, daß für jeden PMQ, den er benutzt, der Kodierer auch einen entsprechenden PMQ spezifizieren muß, der vom verlustfreien Dekodierer in der Matrix 1 zu benutzen ist, und daß die PMQ des Dekodierers in umgekehrter Reihenfolge angewandt werden müssen. Im Fall eines LSB-Bypass impliziert ein Kodierer-PMQ, der auf den zu modifizierenden Kanal einen Koeffizienten von –0.5 anwendet, einen Dekodierer-PMQ, der auf diesen Kanal einen Koeffizienten von –2.0 anwendet. Im Fall des Abwärtsmischens muß der Kodierer die Koeffizienten für die Matrix 0 in Abhängigkeit von der für m₀ und m₁ getroffenen Wahl spezifizieren. Falls ein Kanal skaliert wurde, muß außerdem der Skalierungsfaktor bei der Berechnung der anschließenden Abwärtsmischkoeffizienten, die den Kanal multiplizieren, berücksichtigt werden.
Kodieren von Inhalten gemischter Rate
Die DVD-Audiospezifikation erlaubt es, Aufzeichnungen auf der Platte mit zwei Abtastfrequenzen durchzuführen. So können beispielsweise die vorderen Kanäle L_f, R_f mit einer Abtastrate von 96 kHz kodiert werden, während die übrigen Kanäle mit 48 kHz kodiert werden können, um die Datenrate zu verringern. Aber die vorstehende Beschreibung der gleichzeitigen Übertragung von Abwärtsmischinformation im ersten Teilstrom geht davon aus, daß alle Kanäle gleichzeitig abgetastet werden, und insbesondere mit der gleichen Abtastrate.
In dem Artikel von P. G. Craven, M. J. Law J. R. und Stuart "Lossless Compression using IIR Prediction Filters', J. Audio Eng. Soc., Abstracts, März 1997, Band 45, Nr. 5, S. 404, Vorabdruck Nr. 4415 wird erklärt, daß es bei Anwendung verlustfreier Kompression nicht nötig ist, die Abtastrate zu verringern, um Daten zu sparen. Es reicht, die Bandbreite des Signals zu begrenzen, weil der verlustfreie Kodierer automatisch auf den verringerten Informationsinhalt des Signals anspricht und es auf eine niedrigere Bitrate kodiert.
Ein aufwärts abgetastetes Signal hat von Natur aus eine begrenzte Bandbreite. So hat beispielsweise ein 96 kHz abgetastetes Signal die Fähigkeit, Frequenzen bis zu fast 48 kHz wiederzugeben; aber ein solches Signal hat sehr wenig Energie oberhalb 24 kHz, wenn es durch Aufwärtsabtasten eines 48 kHz abgetasteten Signals abgeleitet ist. Wenn daher die verlustfreie Kompression auf Material gemischter Rate angewandt wird, ist es ohne nennenswerte nachteilige Auswirkung auf die Datenrate möglich, beliebige Kanäle aufwärts abzutasten, die mit niedrigerer Rate vorliegen, zum Beispiel 48 kHz, ehe kodiert wird. Es werden also alle Kanäle mit der gleichen Abtastrate, zum Beispiel 96 kHz kodiert. Diese vereinheitlichte Abtastrate ermöglicht die zur Verwirklichung der Erfindung nötigen Matrixoperationen.
In der Literatur über digitale Signalverarbeitung ist "Aufwärtsabtasten" auch bekannt als "Interpolation", und die Techniken zum Durchführen derselben sind allgemein bekannt. 10 zeigt einen Kodierer, der zum Einschluß dieses Merkmals geeignet ist. Da mit dem Filtern eine Verzögerung einhergeht, wird den Kanälen L_f und R_f, die keine Aufwärtsabtastung brauchen, eine Ausgleichsverzögerung gegeben.
Das Interpolationsfiltern ist insgesamt nicht verlustfrei, aber bei einem bevorzugten Ausführungsbeispiel sind die Aufwärtsabtast-Filter gemäß 10 von der als Halbbandfilter bekannten Art. Wenn Halbbandfilter zur Interpolation herangezogen werden, liefern sie eine Ausgabe mit doppelt so vielen Abtastpunkten wie die eingegebenen Abtastpunkte. Die geradzahligen Ausgabepunkte entsprechen den Eingabepunkten und enthalten mit den Eingabewerten identische Abtastwerte, während die ungeradzahligen Ausgabepunkte halbwegs zwischen den Eingabewerten liegen und interpolierte Werte enthalten.
Wenn ein Strom auf diese Weise kodiert ist, hat das Abspielgerät zwei Dinge zur Wahl. Es kann den Strom so abspielen, als ob alle Kanäle ursprünglich mit 96 kHz abgetastet worden wären und ignoriert damit die unterschiedliche Herkunft der geraden und ungeraden Abtastwerte. Das Abspielgerät kann alternativ im Fall von Kanälen, die dem Kodierer ursprünglich mit 48 kHz vorgelegt wurden, aber auch nur die geraden Abtastwerte auswählen. In diesem Fall hat das Abspielgerät Zugang zu einer verlustfreien Wiederherstellung des Inhalts mit gemischter Rate, der dem Kodierer vorgelegt wurde. Um dies möglich zu machen, muß der kodierte Strom eine Spezifikation darüber, welche Kanäle ursprünglich mit der niedrigeren Abtastrate präsentiert wurden, sowie einen Hinweis darauf enthalten, welche Abtastwerte als gerade und welche als ungerade zu betrachten sind. Letzteres kann impliziert sein, wenn der Strom eine Blockstruktur enthält, bei der die Anzahl Abtastwerte in einem Block immer gerade ist. Auf DVD-Audio bietet die Verwendung von "Zugangseinheiten" und "Präsentationseinheiten" eine solche Struktur.
Die DVD-Audiospezifikation sorgt auf ähnliche Weise für einen Inhalt gemischter Rate mit 88,2 kHz und 44,1 kHz. Das oben beschriebene Kodiermerkmal mit gemischter Rate kann auch auf ähnliche Weise auf diesen Fall angewandt werden.
Verwirklichung
Die zum Durchführen verschiedener Aspekte der Erfindung erforderlichen Funktionen können von Komponenten durchgeführt werden, die auf die verschiedenste Weise implementiert sind, einschließlich diskreter logischer Bauelemente, einer oder mehr ASIC und/oder programmgesteuerter Prozessoren. Die Art, wie diese Bauelemente verwirklicht sind, hat keine kritische Bedeutung. So können beispielsweise Vorgänge, die erforderlich sind, um diese Aspekte der Erfindung in die Tat umzusetzen, in einer Vorrichtung verwirklicht werden, die einen oder mehr Anschlüsse für den Empfang und das Senden von digitale Information wiedergebenden Signalen aufweisen, ferner Direktzugriffspeicher zum Speichern der digitalen Information, einen Träger zum Aufzeichnen eines oder mehrerer Befehlsprogramme und einen Prozessor, der die Befehlsprogramme ausführt. Die Befehlsprogramme können mit einer Vielfalt an maschinenlesbaren Trägern und sonstigen Fertigungsprodukten aufgezeichnet sein, einschließlich verschiedener Arten von Festwertspeichern, Magnetbändern, Magnetplatten, Bildplatten, oder sie können mittels eines Basisbandes oder modulierter Kommunikationswege über das gesamte Spektrum von Überschall- bis zu Ultraviolettfrequenzen übermittelt werden.
Verschiedene Merkmale der Kodier- und Dekodierverfahren und Vorrichtungen sind vorstehend beschrieben worden. Es sei darauf hingewiesen, daß vorgesehen ist, diese Merkmale, sofern sie getrennt verwirklicht werden können, zu kombinieren, um die von diesen Merkmalen gebotenen, verschiedenen Vorteile zu nutzen.

Claims

Dekodierverfahren, aufweisend: Erhalten einer Anzahl N Eingangskanalsignale; Transformieren der Eingangskanalsignale mit einer Matrix, die als Kaskade primitiver Matrixquantisierer verwirklicht ist, um eine Anzahl N Matrixausgangskanalsignale zu schaffen; und Ordnen einer Anzahl N Dekodierausgangskanalsignale, als Reaktion auf die Matrixausgangskanalsignale, in Abhängigkeit von Kanalordnungsinformation, die von den Eingangskanalsignalen abgeleitet ist.
Verfahren nach Anspruch 1, bei dem das Ordnen nach dem Transformieren durchgeführt wird.
Verfahren nach Anspruch 1, bei dem das Ordnen vor dem Transformieren durchgeführt wird.
Verfahren nach einem der Ansprüche 1 bis 3, bei dem die Eingangskanalsignale Kanalsignale links vorn, rechts vorn, links rundum, rechts rundum, Mitte und niederfrequente Effekte eines Sechskanal-Audiosystems darstellen.
Verfahren nach einem der Ansprüche 1 bis 4, bei dem einer der primitiven Matrixquantisierer in der Kaskade aus primitiven Matrixquantisierern ein erster primitiver Matrixquantisierer ist, der ein erstes Kanalsignal verarbeitet, welches eine Reaktion auf eines der Eingangskanalsignale ist, wobei das Verfahren aufweist: Multiplizieren des ersten Kanalsignals innerhalb des ersten primitiven Matrixquantisierers mit einem Verstärkungskoeffizienten, der von den Eingangskanalsignalen erhalten wurde; und Kombinieren des multiplizierten ersten Kanalsignals mit einem oder mehr niedrigstwertigen Bits, die von den Eingangskanalsignalen erhalten wurden.
Kodierverfahren, aufweisend: Erhalten einer Anzahl N Eingangskanalsignale; Transformieren der Eingangskanalsignale mit einer Matrix, die als Kaskade primitiver Matrixquantisierer verwirklicht ist, um eine Anzahl N Matrixausgangskanalsignale zu schaffen; Ordnen einer Anzahl N Kodierausgangskanalsignale, als Reaktion auf die Matrixausgangskanalsignale, in Abhängigkeit von Kanalordnungsinformation; und Erzeugen einer Vielzahl von Teilströmen, die Informationen übermitteln, welche die Kodierausgangskanalsignale und die Kanalordnungsinformation darstellen, wobei ein erster Teilstrom einen strengen Teilsatz der Matrixausgangskanalsignale wiedergibt und eine Abwärtsmischspezifikation enthält.
Verfahren nach Anspruch 6, welches die Kanalordnungsinformation aus der Abwärtsmischspezifikation ableitet.
Verfahren nach Anspruch 7, welches die Kanalordnungsinformation so ableitet, daß ein Kanalsignal, welches den größten Koeffizienten in der Abwärtsmischspezifikation hat, so angeordnet wird, daß es ein erstes Kanalsignal ist, welches in dem ersten Teilstrom wiedergegeben wird.
Verfahren nach einem der Ansprüche 6 bis 8, welches einen primitiven Matrixquantisierer in der Kaskade primitiver Matrixquantisierer anwendet, um ein Kanalsignal zu modifizieren, welches in einem zweiten Teilstrom der Vielzahl von Teilströmen wiedergegeben ist, so daß der zweite Teilstrom verlustfrei komprimiert wird.
Verfahren nach einem der Ansprüche 6 bis 9, bei dem einer der primitiven Matrixquantisierer in der Kaskade primitiver Matrixquantisierer ein erster primitiver Matrixquantisierer ist, der ein erstes Kanalsignal verarbeitet, welches eine Reaktion auf eines der Eingangskanalsignale ist, wobei das Verfahren aufweist: Multiplizieren des ersten Kanalsignals innerhalb des ersten primitiven Matrixquantisierers mit einem Verstärkungskoeffizienten; und Erzeugen der Vielzahl von Teilströmen unter Einschluß des Verstärkungskoeffizienten und eines oder mehr niedrigstwertiger Bits über eine Anzahl von dem ersten Kanal zugeordneten Bits hinaus, die aus der Multiplikation des ersten Kanalsignals resultieren.
Von einer Maschine lesbarer Träger, der ein Befehlsprogramm übermittelt, das von der Machine zur ausführbar ist, um das Verfahren gemäß einem der Ansprüche 1 bis 10 durchzuführen.
Vorrichtung mit Einrichtungen zum Durchführen des Verfahrens gemäß einem der Ansprüche 1 bis 10.
Vorrichtung nach Anspruch 12 mit einem Träger, auf dem ein Befehlsprogramm gespeichert ist, und einem mit dem Träger gekoppelten Prozessor zum Ausführen des Befehlsprogramms, um das Verfahren durchzuführen.
Informationsträger, dessen Information als eine Vielzahl von Teilströmen formatiert ist, die eine Vielzahl von Kanalsignalen wiedergeben, welche mittels einer Matrixtransformation kodiert sind, die eine Vielzahl von Matrixausgangskanalsignalen hat, wobei ein erster Teilstrom in der Vielzahl von Teilströmen einen strengen Teilsatz der Matrixausgangskanalsignale wiedergibt und eine Abwärtsmischspezifikation enthält, und wobei die vom Träger getragene Information ferner Information aufweist, die eine Reihenfolge der Kanalsignale übermittelt, die in der Vielzahl von Teilströmen wiedergegeben sind.
Träger nach Anspruch 14, bei dem die Information auf dem Träger einen Verstärkungskoeffizienten, Information in einem ersten Kanalsignal, multipliziert mit dem Verstärkungskoeffizienten, und ein oder mehr niedrigstwertige Bits des ersten Kanalsignals, aus dem multiplizierten ersten Kanalsignal resultierend, aufweist, die eine Anzahl dem ersten Kanal zugeordneter Bits übersteigen.