DE60006953T2 - Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen - Google Patents

Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen Download PDF

Info

Publication number
DE60006953T2
DE60006953T2 DE60006953T DE60006953T DE60006953T2 DE 60006953 T2 DE60006953 T2 DE 60006953T2 DE 60006953 T DE60006953 T DE 60006953T DE 60006953 T DE60006953 T DE 60006953T DE 60006953 T2 DE60006953 T2 DE 60006953T2
Authority
DE
Germany
Prior art keywords
matrix
channel
signal
channel signals
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60006953T
Other languages
English (en)
Other versions
DE60006953D1 (de
Inventor
Graham Peter Worthing CRAVEN
James Malcolm Upper Beeding LAW
Robert John STUART
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9907918.8A external-priority patent/GB9907918D0/en
Priority claimed from GBGB9907919.6A external-priority patent/GB9907919D0/en
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of DE60006953D1 publication Critical patent/DE60006953D1/de
Publication of DE60006953T2 publication Critical patent/DE60006953T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00992Circuits for stereophonic or quadraphonic recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

  • Gebiet der Erfindung
  • Diese Erfindung betrifft das Kodieren und Dekodieren digitaler Signalströme, insbesondere digitaler Audioströme mit Bezug auf die Matrixbildung von Mehrkanalsignalen.
  • Hintergrund der Erfindung
  • Verlustfreies Komprimieren ist nunmehr ein anerkanntes Mittel zum Reduzieren der zum Speichern oder Senden eines digitalen Audiosignals erforderlichen Datenrate. Eine Methode, die Datenrate eines Mehrkanalsignals zu verkleinern, besteht in der Anwendung der Matrixbildung oder Matrizierung, so daß dominante Information in einigen der übermittelten Kanäle konzentriert ist, während die anderen Kanäle verhältnismäßig wenig Information führen. Ein Zweikanal-Audiosignal kann zum Beispiel nahezu die gleiche Wellenform im linken und rechten Kanal haben, wenn ein zentrales Schallbild übermittelt wird, und in diesem Fall ist es wirksamer, die Summe und die Differenz der beiden Kanäle zu kodieren. Dieses Verfahren ist mehr im einzelnen in WO-A 96/37048 beschrieben und schließt die Verwendung einer Kaskade "primitiver Matrixquantisierer" ein, um das Matrizieren auf perfekt umkehrbare oder verlustfreie Weise zu erreichen.
  • Das in WO-A 96/37048 offenbarte Verfahren sieht auch die Verwendung von Matrixquantisierern vor, um auf ein ursprüngliches digitales Mehrkanalsignal eine Matrix anzuwenden, damit matrizierte digitale Signale abgeleitet werden können, die eine für allgemeines Zuhören im häuslichen Bereich besser geeignete Lautsprecherversorgung darstellen. Diese matrizierten Signale können auf einem Träger, zum Beispiel einem DVD aufgezeichnet werden, und das gewöhnliche Abspielgerät liefert dann einfach jedes matrizierte Signal an einen Lautsprecher. Mit einem fortschrittlichen Abspielgerät kann jedoch die Wirkung der Matrixquantisierer umgekehrt und damit das ursprüngliche digitale Signal genau wiederhergestellt werden, um es auf eine alternative Weise wiederzugeben.
  • Bei kommerzieller Anwendung von DVD-Audio ist es nötig, die beiden obigen Konzepte zu kombinieren, so daß ein Übertragungssystem, bei dem verlustfreie Kompression angewandt wird, gleichfalls sowohl ein matriziertes Signal als auch ein Originalsignal liefern kann. Bei dieser Anwendung hat das erforderliche matrizierte Signal zwei Kanäle, während das Originalsignal mehr als zwei Kanäle hat, so daß Zusatzinformation bereitgestellt werden muß, damit das Mehrkanalsignal wiedergewonnen werden kann; allerdings sollte die Zusatzinformation keinen Rechnerzusatzaufwand für Dekodierer nötig machen, mit denen nur das matrizierte Zweikanalsignal dekodiert werden soll.
  • Gegenwärtig wird die digitale Toninformation häufig mit 24 Bits übertragen und gängige Digitalsignalverarbeitungschips, DSP-Chips, die für Toninformation ausgelegt sind, beispielsweise die Serie Motorola 56000, werden auch leicht mit einem 24-Bit Wort fertig. Aber die in WO-A 96/37048 beschriebene Verarbeitung kann Zahlen generieren, die eine größere Wortbreite als das Originalsignal erfordern. Da die Anwendung der Berechnung mit doppelter Präzision prohibitiv teuer ist, besteht Bedarf an einem Verfahren, mit dem die Verarbeitung im wesentlichen durchgeführt werden kann, aber keine vergrößerte Wortbreite nötig ist.
  • Schließlich möchte auch der Verbraucher, der ein Gerät gekauft hat, das zur verlustfreien Wiedergabe ausgelegt ist, sicher sein, daß das wiederhergestellte Signal tatsächlich verlustfrei ist. Herkömmliche Paritäts- und CRC-Kontrollen innerhalb des kodierten Stroms zeigen auf Datenverfälschung beruhende Fehler innerhalb des Stroms; aber sie legen keine Fehler aufgrund der Matrixbildung oder sonstiger algorithmischer Fehlanpassung zwischen einem Kodierer und einem Dekodierer bloß.
  • Zusammenfassung der Erfindung
  • Gemäß einem ersten Aspekt der Erfindung wird ein Strom geschaffen, der in zwei Teilströme unterteilt ist, von denen der erste Teilstrom Informationen in Bezug auf ein durch Matrizieren erhaltenes "Abwärtsmischsignal" bietet und weniger Kanäle enthält als ein ursprüngliches digitales Mehrkanalsignal, und der zweite Teilstrom Zusatzinformation bietet, die es erlaubt, das ursprüngliche digitale Mehrkanalsignal mittels eines Dekodierers verlustfrei wiederzugewinnen. In dem Zusammenhang, bei dem beide Teilströme mittels verlustfreier Kompression übermittelt werden, braucht ein Dekodierer, der nur das Abwärtsmischsignal dekodiert, nur den ersten Teilstrom zu dekomprimieren und kann deshalb mit weniger Rechnerressourcen auskommen als zum Dekodieren des digitalen Mehrkanalsignals erforderlich sind.
  • Bei einer Variante des ersten Aspekts kann der erste Teilstrom durch eine Vielzahl von Teilströmen ersetzt sein, was die Auswahl einer Vielzahl unterschiedlicher matrizierter Darstellungen erlaubt. Wiederum enthält aber der letzte Teilstrom Zusatzinformation, die ein verlustfreies Wiederherstellen eines kompletten ursprünglichen digitalen Mehrkanalsignals ermöglicht.
  • Bei einer bevorzugten Verwirklichung des ersten Aspektes liefert ein Kodierer das Abwärtsmischsignal mit Hilfe einer Kaskade aus einem oder mehr primitiven Matrixquantisierern, von denen jeder ein n durch n-Matrix verwirklicht, gefolgt durch die Wahl der für das Abwärtsmischen erforderlichen m-Kanäle.
  • Ein Mehrkanaldekodierer nimmt die Signale von beiden Teilströmen und wendet eine Kaskade primitiver Umkehrmatrizes an, um das ursprüngliche Mehrkanalsignal wiederherzustellen. Es könnte für natürlich erachtet werden, die Kanäle, die in die Kaskade des Dekodierers eingegeben werden, so zu ordnen, daß die Kanäle vom ersten Teilstrom am Anfang plaziert werden. Das kann aber zu einer falschen Kanalreihung am Ausgang der Kaskade des Dekodierers führen, so daß vorzugsweise eine Kanalpermutation vom Kodierer spezifiziert und vom Dekodierer verwirklicht wird, um die richtige Kanalreihenfolge wiederzugewinnen.
  • Jeglicher Abstrich oder jegliche Rundung innerhalb der Matrixbildung sollte vorzugsweise unter Zuhilfenahme von Zittern berechnet werden. Für ein verlustfreies Kodieren muß in diesem Fall das Zittersignal dem Dekodierer bereitgestellt werden, damit dieser die vom Kodierer durchgeführten Berechnungen umkehren und folglich das ursprüngliche Signal verlustfrei wiedergewinnen kann. Das Zittern kann durch Anwendung einer "Selbstziffer-Methode" berechnet werden, wie in WO-A 96/37048 vorgesehen; im Zusammenhang mit einem verlustfreien Kompressionsschema kann aber Selbstzittern vermieden werden, wenn man im kodierten Strom einen Zitterkeim vorsieht, der es einem Dekodierer ermöglicht, seinen Zitterprozeß mit dem zu synchronisieren, der vom Kodierer angewandt wurde.
  • Gemäß einem zweiten Aspekt der Erfindung wird also ein verlustfreies Kompressionssystem einschließlich eines Zitterkeims im kodierten Bitstrom geschaffen. Der Zitterkeim wird zum Synchronisieren eines Pseudowillkürfolgegenerators im Dekodierer mit einem funktionell identischen Generator in einem Kodierer verwendet.
  • Bei einer wichtigen Anwendung der Erfindung hat das Abwärtsmischen zwei Kanäle und wird am zweckmäßigsten durch Anwenden von zwei primitiven Matrixquantisierern auf das ursprüngliche digitale Mehrkanalsignal abgeleitet. In Ausführungsbeispielen, mit denen der zweite Aspekt der Erfindung verwirklicht wird, ist für jeden Quantisierer Zittern nötig; ferner sollte unterschiedliches Zittern für die beiden Quantisierer vorgesehen werden, und die bevorzugte Wahrscheinlichkeitsverteilungsfunktion (probability distribution function – PDF) für jedes Zittern ist dreieckig. Eine wirksame Weise zum Erhalten von zwei solchen dreieckigen PDF (TPDF) Zittersignalen, die hier als "Rautenzittern" bezeichnet werden, besteht darin, zwei unabhängige rechteckige PDF (RPDF) Signale zu addieren und zu subtrahieren. Für weitere Einzelheiten und eine Verallgemeinerung auf mehr Kanäle sei verwiesen auf R. Wannamaker "Efficient Generation of Multichannel Dither Signals", AES 103rd Convention, New York, 1997, Vorabdruck Nr. 5433.
  • Dementsprechend arbeitet bei einer bevorzugten Verwirklichung des zweiten Aspektes der Kodierer mit einem einzigen Sequenzgenerator um zwei unabhängige RPDF-Zittersignale zu liefern, und die Summe und Differenz dieser Signale wird benutzt, um das von zwei primitiven Matrixquantisierern erforderte Zittern zu erhalten, die dazu dienen, ein Zweikanal-Abwärtsmischen abzuleiten.
  • In WO-A 96/37048 ist die Verwendung primitiver Matrixquantisierer innerhalb eines verlustfreien Kompressionssystems beschrieben, und vorstehend wurde auf eine bevorzugte Verwirklichung des ersten Aspektes Bezug genommen, bei dem gleichfalls primitive Matrixquantisierer angewandt werden, um die für ein Abwärtsmischsignal erforderliche Information in einen gesonderten Teilstrom zu geben.
  • Gemäß einem dritten Aspekt der Erfindung werden demzufolge Kodierer und Dekodierer bereitgestellt, die ungebundene primitive Matrixquantisierer enthalten, wobei der Kodierer eine Logik besitzt, die eine Abwärtsmischung akzeptiert, die als eine Matrix aus Koeffizienten spezifiziert ist, eine Anzahl primitiver Matrixquantisierer zuteilt, um die Abwärtsmischung zu liefern und wahlweise eine weitere Anzahl zum Matrizieren zuteilt, damit die Datenrate reduziert wird. Der Kodierer liefert einen Strom, der Spezifikationen der zu verwendenden primitiven Matrixquantisierer enthält und wahlweise das Hinzufügen von Zittern enthalten kann. Bei einer bevorzugten Verwirklichung wird das Zittern als zwei RPDF-Zittersequenzen erzeugt, und der Kodierer spezifiziert einen Koeffizienten für jede Zittersequenz. Rautenzittern ist so dadurch zu erhalten, daß zwei Koeffizienten mit dem gleichen Vorzeichen im Fall eines ersten primitiven Matrixquantisierers und zwei Koeffizienten mit entgegengesetzten Vorzeichen im Fall eines zweiten primitiven Matrixquantisierers bestimmt werden.
  • Bei einer elementaren Verwirklichung des dritten Aspektes werden die primitiven Matrizes so gewählt, daß die Abwärtsmischsignale unmittelbar im ersten Teilstrom übertragen werden. Das mag jedoch aus verschiedenen Gründen nicht optimal sein. Wenn man die n-Kanäle eines Mehrkanalteilraums so betrachtet, daß sie einen n-dimensionalen Vektorraum bestimmen, bilden die Signale, die zu einer Nichtnull-Ausgabe in einer linearen Abwärtsmischung führen, einen Teilraum. Wenn die Abwärtsmischung m-Kanäle hat, hat der Teilraum üblicherweise die Dimension m. Die Signale im ersten Teilstrom sollten dann den m-dimensionalen Teilraum optimal übermitteln, wozu es nötig sein kann, daß die übertragenen Kanäle eine matrizierte Darstellung der Abwärtsmischkanäle sind. Das bedeutet, daß die Möglichkeit zur Matrixbildung üblicherweise auch dann nötig ist, wenn ein Dekodierer lediglich zur Wiedergewinnung eines Abwärtsmischsignals ausgelegt ist.
  • Audiosignale werden normalerweise mit höchstens 24 Bit übermittelt, und in einem verlustfreien Wiedergabesystem, wie dem Meridian Lossless Packing (Wz) (MLP) ist sichergestellt, daß die Ausgabe 24 Bit nicht übersteigt, weil die Eingabe nicht über 24 Bit hinausging. Eine Beschreibung des MLP findet sich in "DVD Specifications for Read-Only Disc", Part 4: Audio Specifications, Packed PCM, MLP Reference Information, Version 1.0 März 1999 und in WO-A 96/37048. Im Fall der Abwärtsmischung ist das Ausgangsniveau von der Matrix im Dekodierer bestimmt. Im Prinzip könnte man die Matrixkoeffizienten so skalieren, daß die Ausgabe niemals die durch ein 24-Bit Wort bestimmte Sättigungsschwelle übersteigen kann; in der Praxis führt dies aber zu einem nicht hinnehmbar niedrigen Ausgabepegel. Außerdem ist es für den Kodierer nicht akzeptabel, die Abwärtsmischsignale zu begrenzen oder zu beschneiden, da dies nicht geschehen kann, ohne das rekonstruierte Mehrkanalsignal zu beeinträchtigen, das dann nicht verlustfrei wäre. Ein die Sättigungsschwelle übersteigendes Ausgabeniveau wird hier als "Überlastung" bezeichnet. Eine gelegentliche Überlastung des Abwärtsmischsignals wird für akzeptabel gehalten, abgesehen davon, daß eine digitale Überlastung, wenn man sie "umlaufen" ließe, höchst störend wäre. Die Konsequenz des Umlaufens wird nachfolgend mehr im einzelnen beschrieben. Bei einer bevorzugten Verwirklichung des ersten Aspektes der Erfindung besitzt deshalb ein Dekodierer, der ein Abwärtsmischsignal dekodiert, Möglichkeiten zur Beschneidung oder ähnlichen Begrenzung nach dem Berechnen der Matrix, so daß die Auswirkungen der Überlastung nicht störend werden.
  • Eine weitere Folge der 24-Bit Tradition bei hochqualitativer Toninformation ist die Verfügbarkeit von DSP-Verarbeitungschips mit einer internen Wortbreite von 24 Bit. Jeder primitive Matrixquantisierer, wie in WO-A 96/37048 offenbart, modifiziert einen Kanal eines Mehrkanalsignals durch Hinzufügen von Anteilen der anderen Kanäle. Ein solcher primitiver Matrixquantisierer hat einen durchgehenden Verstärkungsfaktor Eins. Die Erfindung sorgt gemäß einem vierten Aspekt für einen primitiven Matrixquantisierer, der einen Verstärkungskoeffizienten für den modifizierten Kanal akzeptiert und einen zusätzlichen Datenweg mit der Bezeichnung lsb_bypass hat. Die Verstärkung kann auf einen Wert von weniger als Eins gesetzt werden, um Überlastung zu vermeiden. Die quantisierte Ausgabe des primitiven Matrixquantisierers enthält dann weniger Information als ihre Eingabe, wobei die restliche Information in zusätzlichen niedrigstwertigen Bits (least significant bits – LSB) enthalten ist, die durch die Anwendung des Verstärkungskoeffizienten erzeugt werden. Einige oder alle dieser LSB werden dann getrennt über den lsb_bypass Datenweg übertragen. Insbesondere im Fall eines Verstärkungskoeffizienten von ±1/2 wird ein einziges LSB erzeugt, das über lsb_bypass übermittelt werden kann.
  • Gemäß einem fünften Aspekt der Erfindung, der ein lossless_check-Merkmal bietet, wird ein Prüfwert auf der Mehrkanaleingabe in den Kodierer berechnet und im kodierten Strom übermittelt. Der Dekodierer berechnet einen ähnlichen Prüfwert aus der dekodierten Ausgabe und vergleicht ihn mit dem innerhalb des Stroms übermittelten Prüfwert, typischerweise um dem Zuhörer eine visuelle Anzeige, beispielsweise ein Licht "verlustfrei", zu geben, daß die Wiedergabe wirklich verlustfrei ist. Im Fall eines Stroms mit einer Abwärtsmischung gemäß dem ersten Aspekt der Erfindung ist die Abwärtsmischung keine verlustfreie Reproduktion eines Originalsignals. Wenn aber ein synchronisiertes Zittern im Dekodierer gemäß dem zweiten Aspekt vorgesehen und die Matrixbildung des Dekodierers präzise beschrieben ist, wie beispielsweise die Matrixquantisierer gemäß dem dritten Aspekt der Erfindung, ist trotzdem die Abwärtsmischwiedergabe vollständig deterministisch und kann im Kodierer simuliert und einem beherrschenden Ingenieur oder Produzenten zur Probe vorgelegt werden. Der Kodierer kann also einen Prüfwert an der simulierten Abwärtsmischung berechnen, und dieses Wort kann vom Dekodierer geprüft werden, womit die verlustfreie Wiedergabe der gleichen Abwärtsmischung bestätigt wird, die der Probe unterzogen oder zur Probe verfügbar war beim Kodierprozeß.
  • Ein Kodierer, der beispielsweise den Vorquantisierer beinhaltet, der von P. G. Craven und J. R. Stuart in "Cascadable Lossy Data Compression Using a Lossless Kernel", J. Audio Eng. Soc., Abstracts, März 1997, Band 45, Nr. 5, S. 404, Vorabdruck Nr. 4416 beschrieben wurde, hier als "AES 1997" zitiert, und der deshalb das ursprüngliche Mehrkanalsignal vor dem Kodieren ändern kann, hat eine Wahl zur Berechnung des Prüfwertes. Wenn er den Prüfwert aus dem ursprünglichen Signal berechnet, leuchtet eine Anzeige der verlustfreien Wiedergabe, beispielsweise das Licht "verlustfrei" am Dekodierer während Passagen, die geändert wurden, nicht auf. Eine Alternative besteht darin, das geänderte Signal zur Probe als Teil des Kodierprozesses verfügbar zu machen und den Prüfwert aus dem geänderten Signal zu berechnen. Das steht in Übereinstimmung mit dem Fall des Abwärtsmischens, denn in beiden Situationen zeigt das Licht "verlustfrei" eine verlustfreie Wiedergabe eines Signals an, welches zur Probe im Kodierstadium zur Verfügung stand.
  • Bei einer bevorzugten Verwirklichung ist der Prüfwert ein Paritätsprüfwort, welches auf allen Kanälen berechnet wird. Bei einem den ersten Aspekt der Erfindung beinhaltenden Ausführungsbeispiel enthält der erste Teilstrom ein Paritätsprüfwort, welches aus der simulierten Abwärtsmischung errechnet wurde, ehe irgendeine Modifizierung, beispielsweise Beschneiden angewandt wird, um Überlastung zu vermeiden, während der zweite Teilstrom ein Paritätsprüfwort enthält, welches aus dem kompletten Mehrkanalsignal berechnet wurde. Ehe die Parität berechnet wird, wird das jeden Kanalwert darstellende Wort um eine Anzahl von Bits gleich der Kanalzahl gedreht, so daß eine große Wahrscheinlichkeit besteht, einen Fehler zu erkennen, der zwei Kanäle auf identische Weise betrifft.
  • In der gesamten vorliegenden Offenbarung wird speziell auf Kodierverfahren verwiesen, die einen kodierten Strom auf Speicherträgern, beispielsweise DVD aufzeichnen, sowie auf Dekodierverfahren, die den kodierten Strom von solchen Trägern wiedergewinnen. Es sei jedoch darauf hingewiesen, daß gemäß der Erfindung verwirklichte Kodierer auch benutzt werden können, um kodierte Ströme unter Verwendung im wesentlichen aller beliebigen Übertragungsmedien zu senden, einschließlich Basisband oder modulierter Kommunikationswege über das ganze Spektrum von Ultraschall- bis Ultraviolettfrequenzen hinweg, oder daß sie verwendet werden können, um kodierte Ströme auf Speicherträgern aufzuzeichnen, wozu im wesentlichen jede beliebige Aufzeichnungstechnik, einschließlich magnetischer und optischer Techniken, angewandt werden kann. Ähnlich können gemäß der Erfindung verwirklichte Dekodierer benutzt werden, um von solchen Trägern erhaltene kodierte Ströme zu verarbeiten.
  • Kurzbeschreibung der Zeichnungen
  • Beispiele der vorliegenden Erfindung werden nachfolgend unter Hinweis auf die beigefügten Zeichnungen beschrieben. Es zeigt:
  • 1 eine Übersicht über einen verlustfreien Sechskanal-Kodierer, der eine Matrix aufweist, die zum Kodieren der matrizierten Kanäle in zwei Teilströme verwendet wird, die dann zu einem einzigen Strom gebündelt und auf DVD aufgezeichnet werden;
  • 2 einen Mehrkanaldekodierer, der die beiden vom Kodierer gemäß 1 erzeugten Teilströme dekodiert, um eine verlustfreie Wiederherstellung der ursprünglichen sechs Kanäle zu liefern;
  • 3 einen Zweikanaldekodierer, der nur den ersten Teilstrom dekodiert, um eine Zweikanalabwärtsmischung zu liefern;
  • 4a eine Kaskade aus zwei primitiven Matrixquantisierern, die zwei Kanäle eines Vierkanalsignale modifizieren;
  • 4b eine ähnliche Kaskade aus zwei primitiven Matrixquantisierern, die so gestaltet sind, daß sie die Verarbeitung gemäß 4a umkehren;
  • 5a einen primitiven Matrixquantisierer mit Zittern;
  • 5b einen primitiven Umkehrmatrixquantisierer mit Zittern;
  • 6a einen primitiven Matrixquantisierer, der so abgewandelt ist, daß er die "LSB-Bypass"-Möglichkeit bietet sowie die getrennte Übertragung des "bypassed" im Fall einer weiteren verlustfreien Verarbeitung;
  • 6b eine komplementäre Darstellung zu 6a, welche die getrennte Übertragung des bypassed LSB im Fall einer beliebigen verlustfreien Umkehrverarbeitung zeigt sowie einen primitiven Matrixquantisierer, der das bypassed LSB integriert und das ursprüngliche Signal wieder aufbaut;
  • 7a ein Blockschaltbild eines Teils eines Ausführungsbeispiels eines MLP-Kodierers mit LSB bypass;
  • 7b ein Ausführungsbeispiel eines Dekodierers, der zum Kodierer gemäß 7a komplementär ist;
  • 8 einen primitiven Matrixquantisierer, der zur Verwendung in einem Ausführungsbeispiel eines MLP-Dekodierers spezifiziert ist;
  • 9 einen verlustfreien Kodierer, dem ein Vorquantisierer vorausgeht mit einer Ausgabe zur Probe, sowie einen aus der vorquantisierten Ausgabe berechneten "verlustfreien Prüfwert"'
  • 10 eine Vorrichtung zum Kodieren von Signalabtastwerten gemischter Rate mit 48 kHz und 96 kHz, die einen verlustfreien Kodierer aufweist, dem ein Aufwärtsabtaster vorausgeht.
  • Detaillierte Beschreibung der Erfindung
  • Abwärtsmischkodieren und -dekodieren
  • In dem Artikel "Lossless Coding for Audio Discs", J. Audio Eng. Soc. September 1996, Band 44, Nr. 9, SS. 706–720 und der internationalen Patentanmeldung WO-A 96/37048 sind einige der bei der verlustfreien Kompression angewandten Grundsätze erklärt.
  • Eine wichtige kommerzielle Anwendung der verlustfreien Kompression ist bei DVD-Audio, wo es zwei Klassen von Abspielgeräten gibt, den Mehrkanalspieler mit 6 Ausgängen, typischerweise zum Ansteuern einer 5.1 Lautsprecherkonfiguration, und den Zweikanalspieler mit zwei Ausgängen für Zuhörer, der zwei Lautsprecher hat oder für tragbare Verwendung mit Kopfhörern.
  • DVD-Audio hat also die Fähigkeit, ein aufgezeichnetes Audiosignal zweimal zu tragen, einmal als Mehrkanalsignal und wiederum als ein Zweikanalsignal. Das Signal zweimal zu tragen, hat jedoch nachteilige Auswirkungen auf die Abspielzeit. In vielen Fällen wird die ursprüngliche Aufzeichnung nur als Mehrkanalsignal dargestellt, und dem Zweikanalzuhörer wird eine Abwärtsmischung geboten, die vom Mehrkanalmeister abgeleitet ist.
  • Wenn das aufgezeichnete Tonsignal als herkömmliche Abtastwerte in Impulscodemodulation (Pulse Code Modulation – PCM) getragen wird, kann die Platte vorteilhafterweise die Mehrkanalaufzeichnung plus Abwärtsmischkoeffizienten tragen, die es dem Abspielgerät erlauben, eine Zweikanalabwärtsmischung als eine lineare Kombination der Kanäle der Mehrkanalsignale abzuleiten. Ein Abwärtsgemisch aus den beiden Kanälen L0 und R0 könnte zum Beispiel gemäß der unten folgenden Matrixgleichung aus einem Mehrkanalsignal berechnet werden, das die Kanäle links vorn, rechts vorn, links rundum, rechts rundum, Mitte und niederfrequente Effekte umfaßt, die mit Lf, Rf, Ls, Rs, C bzw. Lfe bezeichnet sind.
  • Figure 00080001
  • Die Berechnung der Abwärtsmischung innerhalb des Plattenspielers ist allerdings weniger attraktiv bei Verwendung der verlustfreien Kompression. Alle sechs Kanäle des Mehrkanalsignals müssen dekodiert werden, ehe die obige Matrixgleichung anwendbar wäre, und in diesem Zusammenhang ist der rechnerische Zusatzaufwand für das Dekodieren von sechs Kanälen übermäßig groß.
  • Ein Beispiel, dieses Problem zu lösen, ist in den 1, 2 und 3 gezeigt. In 1 wird das dem Kodierer dargestellte Mehrkanalsignal Matrix 1 zugeführt, in diesem Fall einer 6 × 6 Matrix, deren Ausgänge m0 ... m5 in zwei Teilsätze {m0, m1} und {m2, m3, m4, m5} aufgeteilt sind. Diese Teilsätze werden dann von Kodiererkern 0 und Kodiererkern 1 zu zwei getrennten Teilströmen kodiert, die als Teilstrom 0 und Teilstrom 1 bezeichnet sind. Jeder Teilstrom wird dann durch einen FIFO-Puffer geleitet, und die Teilströme werden in dem Paketierer kombiniert, um einen zusammengesetzten Ausgangsstrom zu erzeugen, der auf einem Träger, wie DVD vorhanden sein kann, wie in der Figur gezeigt. Der Grund für die Verwendung eines FIFO-Puffers ist im US Patent 6 023 233 erörtert und von M. A. Gerzon, P. G. Craven, J. R. Stuart, M. J. Law und R. J. Wilson in "The MLP Lossless Compression System" veranschaulicht worden, wie bei der AES 17th International Conference on High Quality Audio Coding, in Florenz, September 1998 vorgetragen, hier als AES 1998 zitiert.
  • Um das von dem in 1 gezeigten Kodierer kodierte Mehrkanalsignal zu spielen, wird ein Dekodierer verwendet, wie er in 2 gezeigt ist. In diesem Dekodierer empfängt ein Entpaketierer einen kodierten Strom von einem Übertragungsträger oder Speicherträger, beispielsweise DVD, wie gezeigt, zerlegt den kodierten Strom und teilt ihn in zwei Teilströme auf. Jeder Teilstrom wird durch einen FIFO-Puffer und einen Dekodiererkern geleitet, um die Signale m0 ... m5 zu liefern. Diese Signale werden dann durch die Umkehr der Matrix 1 geleitet, um das ursprüngliche Mehrkanalsignal zu liefern.
  • Um ein Zweikanalabwärtsgemisch zu spielen, wird ein Dekodierer wie der in 3 gezeigte benutzt. Hier werden die Teilströme getrennt, aber nur der Teilstrom 0 wird beibehalten, gepuffert und dekodiert, um Signale m0 und m1 zu liefern. Von diesen leitet die Matrix 0 die gewünschten Signale L0 und R0 ab, wobei davon ausgegangen wird, daß der Kodierer die richtige Information in m0 und m1 gepackt hat, damit dies möglich ist. Wenn zum Beispiel die beiden oberen Reihen der Matrix 1 im Kodierer der 1 Abwärtsmischkoeffizienten, wie die in der oben gezeigten 2 × 6 Matrix enthalten, handelt es sich bei den Signalen m0 und m1 um die erforderlichen Abwärtsmischsignale L0 und R0. In diesem Fall ist die Matrix 0 in 3 redundant und kann entweder durch die Identitätsmatrix ersetzt oder weggelassen werden.
  • Ein Unterscheidungsmerkmal der vorliegenden Erfindung ist es, daß es durchgehend verlustfrei sein kann, so daß das Mehrkanalausgangssignal vom Dekodierer gemäß 2 Bit für Bit identisch ist mit dem Eingangssignal, welches der Kodierer in 1 erhält. Falls vorhanden, muß also der Kodierer- und Dekodiererkern verlustfrei sein, und die Matrix 1 und ihre Umkehr müssen gleichfalls verlustfrei sein. Die verlustfreien Kodierer- und Dekodiererkerne können im wesentlichen auf beliebige Weise verwirklicht sein, sofern verlustfreies Kodieren geboten ist; aber in bevorzugten Ausführungsbeispielen werden diese Prozesse gemäß den Prozessen verwirklicht, die in WO-A 96/37048 offenbart sind. Überlegungen zur Verwirklichung der Matrix 1 werden nachfolgend mehr im einzelnen beschrieben.
  • Das herausragende Merkmal der verlustfreien Kodierung erlaubt es einem DVD oder sonstigen Träger, einen kodierten Strom in einer Form zu übermitteln, der eine verlustfreie Wiedergewinnung eines ursprünglichen Mehrkanalsignals erlaubt und außerdem eine einfache Wiedergewinnung einer matrizierten Darstellung oder Abwärtsmischung des ursprünglichen Signals unter Verwendung im wesentlichen des gleichen Speicherraums oder der gleichen Bandbreite wie sie sonst nötig wäre, um nur das ursprüngliche Mehrkanalsignal zu übermitteln. In Ausführungsbeispielen in der Praxis kann der erforderliche Speicherraum oder die erforderliche Bandbreite eines verlustfrei komprimierten Signals, welches eine Abwärtsmischung beinhaltet, sehr geringfügig größer sein als der für das komprimierte Mehrkanalsignal allein benötigte, wegen der im kodierten Strom übermittelten Zusatzinformation, die der Dekodierer braucht, um die Abwärtsmischung umzukehren, und aufgrund der Tatsache, daß die zum Kodieren der Abwärtsmischung verwendeten PMQ nicht zur Verfügung stehen, um den Kodierprozeß zu optimieren.
  • Eine Methode zum verlustfreien Matrizieren besteht in der Verwendung einer Kaskade aus primitiven Matrixquantisierern (PMQ), die als primitive Matrizes in WO-A 96/37048 offenbart sind. Diese PMQ sind Matrizes, die unter Verwendung von Signalwerten aus anderen Kanälen zum Modifizieren des Signals in einem Kanal benutzt werden, und zwar auf eine Weise, die umkehrbar ist. Insbesondere beschreibt WO-A 96/37048 wie eine verlustfreie Umkehrmatrizierung dadurch durchgeführt werden kann, daß die Wirkung jedes Quantisierers in umgekehrter Reihenfolge umgekehrt wird. Das ist in 4a veranschaulicht, wo zwei PMQ in Kaskade zur Verwendung in einem Kodierer gezeigt sind, und in 4b, welche die beiden Umkehr-PMQ in umgekehrter Reihenfolge zeigt. In einfachen Fällen, wo es insbesondere nur zwei primitive Matrixquantisierer gibt, können die Signale S1, S2, S3 und S4 mit zwei Originalkanälen, beispielsweise Lf, Rf, L5, R5 usw. identifiziert werden, und die modifizierten Signale S1' und S2' können mit L0 und R0 oder mit den Signalen m0 und m1 identifiziert werden.
  • Zum Verifizieren der Bit-für-Bit Wiederherstellung des ursprünglichen Signals ist anzumerken, daß dem Quantisierer Q2 in 4b das gleiche Signal zugeführt wird wie dem Quantisierer Q2 in 4a. Unter der Annahme, daß diese identisch sind, erzeugen sie folglich die gleiche Ausgabe q2. In 4a ist das Signal S2' als S2' = S2 – q2 gebildet, während 4b, die Wiederherstellung S2 = S2' + q2 durchführt. Wenn S2 wiederhergestellt ist, wird dem Quantisierer Q1 in 4b das gleiche Signal zugeführt wie dem Quantisierer Q1 in 4a, und das Signal S1 in ähnlicher Weise wiederhergestellt wie das Signal S2.
  • Die Quantisierer Q1 und Q2 sind nötig, um zu verhindern, daß die Wortlänge der modifizierten Signale S1' und S2' die der Eingangssignale S1 und S2 überschreitet, so daß der Informationsinhalt nicht vergrößert wird.
  • 4 zeigt aus Gründen der Einfachheit lediglich vier Kanäle, aber es ist ersichtlich, wie dieses Prinzip auf eine beliebige Anzahl von Kanälen erweitert werden kann, und wie eine größere Anzahl PMQ in Kaskade verwendet werden kann. Jeder PMQ modifiziert nur einen Audiokanal, und in 4 werden nur die beiden ersten Kanäle modifiziert. In der Praxis können irgendwelche der Kanäle oder sämtliche modifiziert werden, und es besteht keine Einschränkung hinsichtlich der Reihenfolge, noch ein Verbot, einen gegebenen Kanal mehr als einmal zu modifizieren. Im Fall einer Zweikanalabwärtsmischung wäre es normal, mindestens die beiden ersten Kanäle zu modifizieren.
  • Es ist ersichtlich, daß jeder PMQ in 4 einen Verstärkungsfaktor Eins zu dem Kanal hat, den er modifiziert. Es ist nicht möglich, die allgemeinste Matrix von einer Kaskade solcher PMQ zu synthetisieren; in WO-A 96/37048 ist erklärt, daß der Satz auf Matrizes beschränkt ist, die eine Determinante gleich Eins haben. Im allgemeinen Fall ist es nötig, die Abwärtsmischgleichungen zu skalieren, um eine Determinante zu erhalten, die eine Einheitsgröße hat. Im Fall der oben schon gezeigten Abwärtsmischgleichungen sollten diese zum Beispiel um 4/3 skaliert werden, so daß die Matrix 1 im Kodierer folgendes verwirklicht:
    Figure 00100001
    während die Matrix 0 im Zweikanaldekodierer die umgekehrte Skalierung verwirklicht:
  • Figure 00110001
  • Es ist klar, daß die Matrix 0 nicht als eine Kaskade von PMQ verwirklicht werden kann, weil ihre Determinante keine Einheitsgröße hat. Das ist aber kein Problem, da die Matrix 0 nicht nötig ist für die verlustfreie Wiederherstellung eines ursprünglichen Signals. 8 zeigt eine Architektur, die weiter unten näher erläutert wird, und die es einem Zweikanaldekodierer ermöglicht, die Matrix 0 entweder als eine strenge Kaskade von PMQ zur verlustfreien Dekodierung eines ursprünglichen Zweikanalsignals oder als eine mehr allgemeine Matrix für Abwärtsmischanwendungen zu verwirklichen.
  • Um die Koeffizienten für die die Matrix 0 bildenden PMQ zu berechnen, kann folgendes Verfahren angewandt werden. Die Matrix der Abwärtsmischkoeffizienten wird beispielsweise in dem oben erwogenen Fall mit "downmix" bezeichnet, dann ergibt sich
  • Figure 00110002
  • Dann wird für j = 1 ... 6 berechnet:
  • Figure 00110003
  • Dann wird berechnet
    Figure 00110004
    und dann wird für j = 3 ... 6 berechnet:
  • Figure 00110005
  • Die Koeffizienten m_coeff in 4a und 4b für ij sind nun gegeben durch den Ausdruck m_coeff[i, j] = –coeffi,j wo das Minuszeichen wegen der Subtraktion in 4a entsteht.
  • Im Mehrkanaldekodierer der 2 kann die Umkehrmatrix 1 wie in 4b verwirklicht werden, wobei die gleichen Werte m_coeff[i, j] wie beim Kodierer, aber mit der umgekehrten Reihenfolge der PMQ und dem Ersatz jeder Subtraktion in jedem kodierenden PMQ durch eine Addition verwendet werden, wie gezeigt. Es sei erwähnt, daß die Eingaben m0 ... m5 in die Kaskade der PMQ in diesem Fall von zwei Teilströmen abgeleitet sind.
  • Auch wenn die bisher beschriebene Erfindung besonders relevant ist im Zusammenhang mit der Kompression, ist sie doch allgemein anwendbar und nicht auf Kompressionssysteme beschränkt. Außerdem ist der oben beschriebene Grundsatz nicht auf die zwei Teilströme beschränkt. Bei Verwendung von drei Teilströmen kann zum Beispiel ein Neunkanalsignal verlustfrei übermittelt werden, wobei die zum Dekodieren einer Sechskanalabwärtsmischung benötigte Information in den beiden ersten Teilströmen getragen ist und die Information für das Dekodieren einer Zweikanalabwärtsmischung (als lineare Kombination der sechs Kanäle) nur im ersten Teilstrom getragen ist.
  • In gegenwärtigen kommerziellen Anwendungen multiplizieren insgesamt in der die Abwärtsmischsignale L0 und R0 definierenden Matrix hinsichtlich Lf, Rf, Ls, Rs, C und Lfe die größten Koeffizienten Lf und Rf, wie im Fall des obigen Beispiels. Diese Situation kann aber nicht garantiert werden, da die dominanten Koeffizienten unter Umständen einige der anderen Signale multiplizieren. Wenn die Koeffizienten von Lf und Rf tatsächlich klein sind, entsteht ein Problem aufgrund des Erfordernisses, daß ein PMQ eine Einheitsverstärkung für den Kanal haben muß, den er modifiziert, weil ein oder mehr weitere Kanäle entsprechend aufwärtsskaliert sein sollten. Bei Anwendung eines oben gezeigten einfachen Skalierens, um dieses Problem zu lösen, werden andere Koeffizienten der Matrix die Einheit überschreiten, und folglich eine Überlastung oder sonstige Schwierigkeiten entstehen.
  • Dieses Problem kann mit einer Permutation der Kanäle im Kodierer angegangen werden, so daß zum Beispiel ein erster Kanal, dessen Koeffizient in L0 am größten ist, an den Anfang einer Folge gebracht würde, und ein zweiter Kanal, dessen Koeffizient in R0 am größten ist, an die zweite Stelle gegeben wird. In diesem Beispiel wird angenommen, daß der erste Kanal und der zweite Kanal nicht derselbe sind. Diese Umordnung macht es normalerweise dem Kodierer möglich, matrizierte Signale m0 und m1 zu liefern, die zu L0 und R0 proportional sind, indem zwei PMQ benutzt werden, deren Koeffizienten nicht wesentlich über Eins hinausgehen, um die beiden ersten Kanäle zu modifizieren.
  • Bei einer derartigen Permutation im Kodierer ist im Mehrkanaldekodierer gemäß 2 eine Umkehrpermutation nötig, um die Signale in der richtigen Reihenfolge wiederherzustellen. Eine Neuabbildung der Ausgangskanäle wird in einem MLP-Dekodierer gemäß Anweisung durch die ch_assign Information im kodierten Strom geboten. Wenn der Kodierer eine Permutation anwendet, kann er den Dekodierer anweisen, eine Umkehrpermutation anzuwenden, indem er die richtige Neuabbildung spezifiziert.
  • Die Umkehrpermutation wird angewandt nach dem Matrizieren des Dekodierers, wenn der Kodierer vor dem Matrizieren eine Permutation anwendet. Eine andere Möglichkeit wäre es, die Permutation im Dekodierer vor dem Matrizieren anzuwenden, wenn im Kodierer nach dem Matrizieren eine Permutation angewandt wird. Darüber hinaus wäre es möglich, daß ein Dekodierer eines MLP-Stroms die Permutation vor dem Matrizieren anwendet, wenn die Koeffizienten der Matrix auch permutiert sind.
  • Es gibt gewisse unwahrscheinliche, aber doch mögliche Abwärtsmischspezifikationen, die die oben umrissenen Strategien nicht handhaben können. Eine Möglichkeit besteht darin, daß L0 und R0 Koeffizienten haben können, die die gleichen oder nahezu die gleichen sind oder, anders ausgedrückt, die Abwärtsmischung mono oder nahezu mono ist. In dieser Situation ist das obige Verfahren nicht zufriedenstellend, weil der Denominator des Ausdrucks für coeff2,1 Null oder nahezu Null wird, was zu großen Koeffizienten und einer hohen Wahrscheinlichkeit einer Überlastung führt. Dieses Problem kann gelöst werden durch unterschiedliche Wahl für m0 und m1. Wenn man die Signale als Elemente eines Vektorraums betrachtet, reicht die Spanne der Signale L0 und R0 im allgemeinen über einen zweidimensionalen Teilraum des sechsdimensionalen Euklidischen Vektorraums oder insgesamt eines n-dimensionalen Euklidischen Vektorraums, dessen Kanäle des Mehrkanalsignals eine orthonormale Basis bilden. Die Reichweite der Signale m0 und m1 muß über diesen Teilraum gehen, wenn L0 und R0 wiederhergestellt werden sollen. Es ist vernünftig, m0 und m0 orthogonal oder nahezu orthogonal zueinander in dem Teilraum zu wählen, über den die Spannweite von L0 und R0 reicht. Nach der Bestimmung von m0, ausgedrückt als Eingangskanäle, können diese Kanäle vor der Matrix permutiert werden, so daß ein Kanal, dessen Koeffizient in m0 am größten ist oder im wesentlichen am größten, als erstes kommt. Dann wird ein PMQ berechnet, so daß der als erstes gesendete Kanal eine skalierte Version des gewünschten m0 ist. Dann ist es nötig, einen PMQ zu berechnen, um eine skalierte Version von m1 zu erhalten. Es kann wiederum eine vorherige Permutation wünschenswert sein, um die Größe der Koeffizienten auf ein Minimum einzuschränken. Diese Permutation der zu matrizierenden Signale ist dem Prozeß verwandt, der dem Fachmann für Matrixberechnungen als "partial pivoting" bekannt ist und hier nicht näher beschrieben wird. Anfangs kann m0 und m1 eine willkürliche Skalierung gegeben werden. Dann kann das obige Verfahren zur Bestimmung der Koeffizienten benutzt werden, indem die Matrix downmix durch die Matrix ersetzt wird, die m0 und m1, ausgedrückt als die ursprünglichen Kanäle, wiedergibt. Die durch dieses Verfahren festgelegten Koeffizienten bestimmen dann die tatsächliche Skalierung von m0 und m1.
  • Im dem Fall der Degenerierung, bei der L0 und R0 identische Signale oder skalierte Versionen voneinander sind, ist der Teilraum, über den L0 und R0 hinweg reichen, eindimensional. In diesem Fall kann m0 willkürlich innerhalb des Teilraums gewählt werden, und m1 kann orthogonal zu m0, aber von außerhalb des Teilraums gewählt werden. Die Matrix 0 in einem Zweikanaldekodierer stellt dann L0 und R0 als eine skalierte Version von m0 wieder her und ignoriert m1.
  • In dem MLP-System verlustfreier Kompression werden die Koeffizienten der Matrix 0 im ersten Teilstrom geführt. Der Teilstrom 0 und die Koeffizienten der Matrix 1 werden vollständig im zweiten Teilstrom geführt, dem Teilstrom 1, auch wenn einige dieser Koeffizienten zum Multiplizieren von aus dem ersten Teilstrom dekodierten Signalen verwendet werden.
  • Abwärtsmischkodieren kombiniert mit Reduktion der Datenrate
  • Matrixbildung anwendende, verlustfreie Kodierer sind ausführlich in WO-A 96/37048 beschrieben, wo der Zweck der Matrizierung darin besteht, die Korrelation zwischen den übertragenen Kanälen zu verringern, um dadurch die übertragene Datenrate zu verringern. Wenn ein Abwärtsmischen kodiert werden soll, wie oben beschrieben, ist das Matrizieren teilweise durch die Notwendigkeit des Abwärtsmischens spezifiziert, aber es bleibt noch beträchtlicher Freiraum in der Spezifikation übrig.
  • Zunächst erlaubt die Bedingung bei der Wahl von m0 und m1, daß sie etwa orthogonal sein müssen, immer noch, eine willkürliche Rotation innerhalb des Teilraums unter L0 und R0 vorzunehmen. Diese Freiheit kann dazu verwendet werden, die zum Kodieren des ersten Teilstroms, beispielsweise des Teilstroms 0 erforderliche Datenrate auf ein Minimum einzuschränken und dazu die in WO-A 96/37048 beschriebenen Verfahren anzuwenden, mit denen die von einem beliebigen Signal von zwei oder mehr Kanälen genommene Datenrate auf ein Minimum gesenkt wird.
  • Zweitens bleibt bei einem Mehrkanalsignal mit sechs Kanälen als Ausgangsbeispiel die Matrizierung der vier Kanäle, die nicht modifiziert werden, um das Abwärtsgemisch zu liefern, immer noch vollständig unspezifiziert. Wiederum können die in WO-A 96/37048 beschriebenen Verfahren angewandt werden, um die zum Kodieren des zweiten Teilstroms, Teilstrom 1, erforderliche Datenrate auf ein Minimum zu senken. Im Fall einer PMQ-Verwirklichung können zwei PMQ verwendet werden, um die Abwärtsmischung abzuleiten, und jeglicher übrig bleibende PMQ kann herangezogen werden, um die Datenrate der übrigen vier Kanäle in der gleichen Weise wie für irgendein anderes Vierkanalsignal zu minimieren. Im MLP-Kompressionssystem stehen insgesamt sechs PMQ zur Verfügung, was es möglich macht, dieser Aufgabe vier zuzuteilen.
  • Zittern
  • In audiophilen Kreisen wird es gegenwärtig für außerordentlich wichtig erachtet, daß jegliche Quantisierung, die einen Einfluß auf die Wiedergabe des Tonsignals hat, unter Zuhilfenahme von Zittern durchgeführt wird. Es ist üblich, dem Signal, ehe es dem Quantisierer zugeleitet wird, einen kleinen pseudowillkürlichen Zitterwert hinzuzufügen. Siehe zum Beispiel S. P. Lipshitz, R. A. Wannamaker und J. Vanderkooy, "Quantization and Dither: A Theoretical Survey," J. Audio Eng. Soc., Mai 1992, Band 40, SS. 355–375.
  • Die primitiven Matrixquantisierer führen von Natur aus eine Quantisierung durch. Im Fall der verlustfreien Kodierung und Dekodierung ist das Fehlen von Zittern kein Problem, weil das verlustfreie Matrizieren im Dekodierer genau die vom Kodierer durchgeführte Matrizierung umkehrt, einschließlich jeglicher Quantisierungseffekte. Aber wenn eine Abwärtsmischung geliefert wird, wie vorstehend beschrieben, wird von der Matrix 0 der Effekt der Matrix 1 nicht umgekehrt, und die Abwärtsmischung enthält Quantisierungseffekte von beiden Matrizes.
  • Um die Abwärtsmischquantisierung gutartig zu machen, muß von beiden Matrizes Zittern hinzugefügt werden. Das Hinzufügen von Zittern in der Matrix 1 des Kodierers hat aber Einfluß auf das übertragene Signal, und das Dekodieren des Mehrkanalsignals wird dadurch beeinträchtigt. Deshalb muß zum verlustfreien Dekodieren die Umkehrmatrix 1 im Mehrkanaldekodierer die Auswirkung des Zitterns im Matrizieren des Kodierers ausgleichen.
  • Die 5a und 5b zeigen ein komplementäres Paar primitiver Matrixquantisierer einschließlich Zittern, im vorliegenden Fall für ein Dreikanalsignal. Die beiden Matrixquantisierer unterscheiden sich nur darin, daß das Signal q1 in dem in 5a gezeigten Quantisierer subtrahiert wird, während das gleiche Signal in dem in 5b gezeigten Quantisierer hinzugefügt wird. Damit ist leicht zu erkennen, daß unter der Voraussetzung, daß das von dem "dither" markierten Kasten gelieferte Signal in beiden Fällen gleich ist, die Tätigkeit des PMQ in 5a vom PMQ in 5b rückgängig gemacht wird. So kann ein Kodierer, wie er in 1 gezeigt ist, aufgebaut werden, bei dem Matrix 1 eine Kaskade aus PMQ wie in 5a gezeigt ist, und der Mehrkanaldekodierer gemäß 2 kann mit einer Umkehrmatrix 1 aufgebaut werden, die eine Kaskade aus PMQ in umgekehrter Reihenfolge ist, wie in 5b gezeigt. Damit ist sichergestellt, daß das Mehrkanalsignal verlustfrei wiederhergestellt wird.
  • Um die beste Qualität der Abwärtsmischwiedergabe zu erhalten, sollten die herkömmlichen Erfordernisse hinsichtlich des Zitterns sowohl in der Matrix 1 des Kodierers als auch in der Matrix 0 des Dekodierers erfüllt sein. Im Kodierer beispielsweise könnte der in 5a und 5b gezeigte Zittergenerator vorteilhafterweise TPDF-Zittern mit einer Amplitude von Spitze zu Spitze gleich zwei Quantisierungsschritten des Quantisierers Q liefern. Wenn die beiden ersten PMQ im Kodierer das Abwärtsmischsignal liefern, ist es nicht nötig, den späteren PMQ Zittern hinzuzufügen.
  • Die Matrix 0 kann eine andere Art von Matrix sein, umfaßt aber in jedem Fall eine Berechnung, womit die Wortlänge vergrößert wird, gefolgt durch die Quantisierung, und es ist normal, vor jeder Quantisierung Zittern hinzuzufügen.
  • Die Notwendigkeit, in den Kodier- und Dekodierquantisierern gemäß 5a und 5b identisches Zittern vorzusehen, kann dadurch erfüllt werden, daß der Kodierer einen den Zustand eines Pseudowillkürfolgegenerators übermittelnden Keim innerhalb des Stroms von Zeit zu Zeit aufzeichnet und der Dekodierer den Keim liest und dadurch seinen eigenen Folgegenerator synchronisiert.
  • Im Fall von MLP ist der Folgegenerator ein 23-Bit kreisförmiges Schieberegister, welches eine pseudowillkürliche binäre Sequenz (PRBS) unter Verwendung des Ausdrucks b23 ⊕ b5 ⊕ 1erzeugt, worin bx das Bit x des Schieberegisters und ⊕ die Operation "exclusive-OR" darstellt.
  • Der Keim im Strom ist also 23 Bit lang. Das Schieberegister wird pro Abtastperiode um 16 Bit verschoben. Das macht es möglich, für jeden Signalabtastwert eine neue 16-Bit Pseudowillkürzahl mit einer rechteckigen PDF zu erzeugen. Da aber ein TPDF-Zittern bevorzugt wird, sind die 16 Bit in zwei 8-Bit Zitterabtastwerte aufgeteilt. Diese 8-Bit Abtastwerte haben jeweils eine rechteckige PDF, aber der Kodierer hat die Wahl, diese beiden Abtastwerte zu addieren und zu subtrahieren, um zwei weitere nicht korrelierte Zitterabtastwerte mit einer dreieckigen PDF zu liefern. Dieser Prozeß ist als Rautenzittern bekannt und in der oben genannten Veröffentlichung von Wannamaker, AES Vorab druck Nr. 4533, erläutert. Der Kodierer kann diese beiden dreieckigen PDF-Abtastwerte benutzen, um zwei, das Abwärtsmischsignal liefernden PMQ Zittern hinzuzufügen.
  • Audiophile Erwägungen machen es nicht nötig, das in der Matrix 0 zur Wiedergewinnung des Abwärtsmischsignals aufgebrachte Zittern mit einem entsprechenden Prozeß im Kodierer zu synchronisieren. Im Gegenteil, es ist sogar unerwünscht, das gleiche Zittern anzuwenden, oder daß die Matrix 0 irgendein beliebiges Zittern anwendet, das mit dem in der Matrix 1 angewandten Zittern korreliert ist. Beim MLP erzeugt der Abwärtsmischdekodierer ein Zittersignal unter Verwendung des gleichen Algorithmus wie der Mehrkanaldekodierer; aber das Zittern ist anders, weil der Keim anders ist. Der Keim für das Zitern der Matrix 0 wird im Teilstrom 0 getragen, während der Keim für das Zittern der Matrix 1 im Teilstrom 1 getragen ist.
  • Im Fall von MLP ist die Quantisierung und Arithmetik der Matrix 0 ebenso exakt spezifiziert wie für die Matrix 1, und da auch das Zittern vom Kodierer gesteuert wird, hat der Kodierer exakte Kenntnis der vom Dekodierer wiedergewonnenen Signale L0 und R0, bis herab zum letzten Bit. Hierauf wird später noch zurückzukommen sein.
  • Sättigung der Abwärtsmischung
  • Häufig wird es für kommerziell wichtig gehalten, ein Tonsignal auf dem höchstmöglichen Pegel zu kodieren, den der digitale Kanal handhaben kann. Bei "live" Musik können Spitzen sehr unkontrolliert sein, und der Durchschnittspegel muß gut unterhalb der digitalen Beschneidung gehalten werden, wenn keine Spitze eines "live" Signals eine Überlastung verursachen soll. Aber der professionelle Aufzeichnungsingenieur ist mit Werkzeugen für die Wellenformmodifikation gut ausgestattet, beispielsweise mit Beschneidungs- und Begrenzungsinstrumenten, die es ihm erlauben, ein kontrolliertes Signal zu erzeugen, welches einen Kanal sehr vollständig moduliert und dabei gleichzeitig sicherstellt, daß keine Spitze zu Überlastung führt.
  • Es ist ersichtlich, daß eine digitale Überlastung zu äußerst unangenehmen Artefakten führen kann, die durch "Umlauf"-Wirkungen verursacht werden. Im herkömmlichen 2er-Komplement 24-Bit Tonsignal ist beispielsweise der maximale positive Wert durch 7fffff hexadezimal wiedergegeben. Ein naiver Versuch, diesen Wert um eine Quantisierungsstufe zu erhöhen, führt zu 800000 hexadezimal, was als maximale negative Auslenkung interpretiert wird. Kleine Überlastungen erzeugen also Übergänge über die gesamte Skala, die einen großen hochfrequenten Energiegehalt haben, was außerordentlich unangenehm klingt und oft das Durchbrennen von Hochtönern verursacht.
  • Im Zusammenhang mit der DVD-Mastererstellung wird davon ausgegangen, daß ein gesteuerter Mehrkanal-Master produziert und für die verlustfreie Kodierung bereitgestellt wird. Mit anderen Worten, es wird davon ausgegangen, daß irgendwelche Überlastprobleme bei der Herstellung des Mehrkanalsignals bereits erledigt wurden. Es bleibt also Aufgabe, eine akzeptable L0R0 Abwärtsmischung hervorzubringen.
  • Eine Überlastung am Ausgang des in 3 gezeigten Zweikanaldekodierers kann vermieden werden, wenn die Koeffizienten der Matrix 0 genug abwärts skaliert werden. Dieses Abwärtsskalieren bringt aber zwei Schwierigkeiten mit sich. Zunächst einmal ist das erforderliche Ausmaß der Skalierung nicht bekannt, bis das gesamte Programmaterial geprüft worden ist, was auf der Stufe der Mastererzeugung unbequem ist. Zweitens führt ein derartiges Skalieren wahrscheinlich zu einer Abwärtsmischung, die gemäß wirtschaftlicher Normen unannehmbar ruhig ist. Das liegt daran, daß vorhergehendes Beschneiden oder Begrenzen des Mehrkanalsignals nicht notwendigerweise wirksam ist, das Verhältnis von Spitze zu Durchschnitt einer vom Mehrkanalsignal abgeleiteten Abwärtsmischung einzuschränken.
  • Es ist nicht möglich, die Abwärtsmischung auf der Kodierstufe einzustellen, denn das würde zu einer Änderung der Übertragung von m0 und m1 führen, und die Wiederherstellung des Mehrkanalsignals könnte dann nicht verlustfrei sein.
  • Dementsprechend wird mit der Erfindung dafür gesorgt, daß ein Abwärtsmischdekodierer die Fähigkeit besitzt, intern ein Abwärtsmischsignal zu erzeugen, dessen Amplitude größer ist als ein digitaler Ausgang handhaben kann, und einen Begrenzer oder Beschneider vor der endgültigen Ausgabe einzubauen, so daß eine Überlastung des Abwärtsmischsignals ohne unangenehme Auswirkungen behandelt wird.
  • Beim MLP ist die Ausgangswortbreite auf 24 Bit festgelegt, und die meisten der interen Signalwege, einschließlich der Wege zwischen den PMQ sind gleichfalls als 24 Bit breit spezifiziert. Aber nach dem letzten PMQ im Dekodierer ist ein Verschieber vorgesehen, der links oder rechts um eine variable Zahl von Bits verschiebt, die von "output_shift"-Information bestimmt ist, welche von Zeit zu Zeit im kodierten Strom getragen ist. Wenn der Kodierer eine Eingabe und eine Abwärtsmischspezifikation erhält, die zu einer Abwärtsmischung führen, für die mehr als 24 Bit erforderlich sind, wird die Abwärtsmischspezifikation vom Kodierer abwärts skaliert, um eine Überlastung innerhalb der Matrixbildung zu vermeiden. Das Abwärtsskalieren geschieht um eine Zweierpotenz, so daß die richtige Amplitude im Dekodierer dadurch wiederhergestellt werden kann, daß eine positive Linksverschiebung in der "output_shift"-Information vorgeschrieben wird. Der Verschieber im Dekodierer erzeugt also ein Abwärtsmischsignal der richtigen Amplitude, und das kann dann für die 24-Bitausgabe zu groß sein. Deshalb ist zwischen dem Shifter und dem Ausgang ein Beschneider angeordnet, um die vorstehend erwähnte, unerwünschte Umlaufwirkung zu vermeiden. Es ist zweckmäßig, den Beschneider unter Zuhilfenahme der in vielen DSP-Chips vorhandenen Möglichkeit zu verwirklichen, gemäß der ein Wert in einem Akkumulator mittels Sättigungsarithmetik in einen Speicher eingespeichert werden kann.
  • Zusätzliche Synergie ergibt sich in diesem Fall, wenn der Speicherort, an dem der Akkumulator gespeichert wird, in Abhängigkeit von der "ch_assign"-Information im Strom berechnet werden kann. Damit wird eine Umkehrpermutation von Kanälen bewirkt, die in einem Dekodierer erforderlich ist, ohne daß hier ein gesonderter Vorgang vorgesehen werden muß.
  • LSB-Bypass
  • Wenn ein Eingabesignal den vollen 24-Bit Bereich ausnutzt, besteht die Wahrscheinlichkeit, daß ein Versuch zur Modifizierung eines Kanals mittels eines PMQ gemäß 4 oder 5 zu einem Signal führt, welches den 24-Bit Bereich übersteigt. Dieser vergrößerte Bereich, der beim verlustfreien Kodier- und Dekodierverfahren intern bleibt, kann wirtschaftlich sogar von einem Prozessor mit 24-Bit Arithmetik hingenommen werden, wenn die Architektur gemäß 6 benutzt wird.
  • 6a zeigt links einen PMQ mit eingebautem Verschieber. Es wird davon ausgegangen, daß die Signalwege insgesamt eine Breite von 24 Bit haben; aber nach der Subtraktion des quantisierten Signals q von S1 steht ein 25-Bit Datenweg zur Verfügung, um Platz für die Addition zu schaffen. Das Signal wird dann artithmetisch nach rechts um ein Bit verschoben, und das vom Boden des Wortes verschobene LSB wird getrennt von der Hauptausgabe S1' ausgegeben, die die übrigen Bit bis zur Höhe von 24 enthält.
  • Das so herausgeschobene LSB muß natürlich mit dem Signal geführt werden. Um die Signale S1, S2 und S3 zu dekodieren, sollte das LSB zusammen mit den Signalen S1', S2 und S3 dem rechts in 6b gezeigten Umkehr-PMQ zugestellt werden. Hier wird das LSB an S1' angehängt und das Ergebnis um ein Bit nach links verschoben, so daß das gesondert getragene LSB das LSB des verschobenen Wortes ist, wodurch ein 25-Bit Signal entsteht, zu dem das quantisierte Signal q summiert ist. Wegen der verlustfreien Wiederherstellung des Signals S1, welches als Eingabe in den PMQ in 6a eingegeben wurde, ist das Additionsergebnis unter der Vorausetzung, daß S1 ein 24-Bit Signal ist, nur 24 Bit breit.
  • Wie in 6a rechts und in 6b links gezeigt, ist es möglich, zwischen den beiden komplementären PMQ eine weitere verlustfreie Verarbeitung und eine umgekehrte verlustfreie Verarbeitung des 24 Bit breiten Weges einzufügen, vorausgesetzt es gibt einen Umgehungsweg, so daß das LSB gesondert übermittelt wird. Ein Teilblockschaltbild eines MLP-Kodierers ist beispielsweise in 7a und ein entsprechender Dekodierer in 7b gezeigt. Nach der in 7a gezeigten Matrix kommt ein Dekorrelator und ein Entropiekodierer, so daß bei diesem Beispiel das in 6a gezeigte verlustfreie Verarbeiten diese Posten einschließen würde. Unter Hinweis auf 7b könnte ähnlich das in 6b gezeigte umgekehrte verlustfreie Verarbeiten einen Entropiedekodierer und einen Rekorrelator umfassen. Wie aus 7a und 7b hervorgeht, ist dafür gesorgt, daß über diese Verarbeitung hinweg das auf den Umweg geschickte LSB erhalten bleibt, daß es in den kodierten Strom oder Teilstrom gespeichert und aus diesem wiedergewonnen wird.
  • Manchmal verursacht die Matrixbildung beim MLP keine Überlastung; aber der Dekorrelator, der zwar insgesamt dazu bestimmt ist, die Signalamplitude zu verkleinern, vergrößert diese an bestimmten Abtastwerten und wirkt damit einem Überlastproblem entgegen. In diesem Fall kann ein PMQ des in 6a gezeigten Typs verwendet werden, um die Amplitude des Signals zu verkleinern und damit etwa 6 dB Platz für weitere Verarbeitung schaffen. Die in 6 gezeigten Koeffizienten können auf Null gesetzt werden, wenn ein PMQ für diesen Zweck allein benutzt wird.
  • Es ist klar, daß das Schema gemäß 6a verallgemeinert werden könnte, um mehr als ein Bit aus einem PMQ heraus zu verschieben und als Umgehungssignal zu übertragen. Das geschieht nicht im Fall vom MLP.
  • Die in 6a gezeigte Verarbeitung ist verlustfrei, und auch die entsprechende umgekehrte verlustfreie Verarbeitung in 6b ist verlustfrei. Das macht es möglich, diese Verarbeitung zu verschachteln. So könnte beispielsweise das rechts in 6a gezeigte verlustfreie Verarbeiten einen PMQ der links in 6a gezeigten Art umfassen, und die Kodierwirkung dieses verschachtelten PMQ könnte dadurch umgekehrt werden, daß in die links in 6a gezeigte, umgekehrte verlustfreie Verarbeitung ein PMQ von der rechts in 6b dargestellten Art eingefügt wird. In diesem Fall würde auf jeder Stufe ein umgangenes LSB erzeugt, so daß zwei umgangene LSB um jedes weitere Verarbeiten herum geführt werden müssen.
  • In einem MLP-Kodierer gibt es bis zu sechs PMQ in Kaskadenanordnung, und irgendwelche derselben oder alle können so gestaltet sein, daß sie ein umgangenes LSB bereitstellen. So kann der Teilstrom bis zu sechs umgangene LSB, eins von jedem PMQ, führen. Auch wenn jedes umgangene LSB von einem anderen PMQ stammt, müssen sie nicht von unterschiedlichen Kanälen kommen, und der Kodierer kann gelegentlich sogar beschließen, zwei oder mehr derartiger PMQ einem Kanal zuzuordnen und damit zusätzliche 12 dB oder mehr Platz für diesen Kanal gewinnen.
  • Es gibt Varianten der in 6a und 6b gezeigten Topologie, die eine gleichwertige Wirkung haben. Die Subtraktion des Signals q in 6a und die Addition des Signals q in 6b könnten ausgetauscht werden. Eine Subtraktion kann vermieden werden durch Umkehr des Vorzeichens der Koeffizienten, durch Umkehr des Vorzeichens des Zitterns, falls angewandt, und, wenn nötig, durch die Vornahme einer Einstellung am Quantisierer Q, beispielsweise durch einen Austausch eines Quantisierers, der abrundet, durch einen Quantisierer, der aufrundet. Eine weitere Variation besteht darin, den Quantisierer Q im Vorwärtsweg anzuordnen, wie in 23a von WO-A 96/37048 gezeigt, statt in der Seitenkette, wobei wiederum bei der Wahl von Quantisierern, die aufrunden oder abrunden, Sorgfalt angewandt wird. In 6b kann, statt das Signal S1' und LSB zusammen zu verschieben, auch eine Verschiebung des Signals S1' nach links vorgenommen werden, wodurch ein LSB von Null entsteht, und dann kann das getrennt übermittelte LSB hinzugefügt werden. In diesem Fall kann die Addition des getrennt übermittelten LSB mit der Addition des quantisierten Signals q kombiniert oder nach dieser vorgenommen werden. In Ausführungsbeispielen für MLP sollte die Addition eine 24-Bit Zahl hervorbringen.
  • 8 zeigt den für MLP spezifizierten Dekodierer-PMQ, der so gestaltet ist, daß er drei Kanäle S1, S2 und S3 wiederherstellt, wobei der zweite Kanal S2 modifiziert wird. Das umfaßt einige der oben erörterten Variationen und sieht zusätzlich eine allgemeine Multiplikation vor, um die Linksverschiebung zu verwirklichen. Der Kodierer spezifiziert die Koeffizientenwerte und schließt sie in den Strom ein. Um das Signal S2' um ein Bit nach links zu verschieben, könnte der Kodierer den Koeffizienten m_coeff[2,2] auf +2 setzen. Bei MLP werden 16-Bit Koeffizienten im Bereich [–2, +2) benutzt, so daß der genaue Wert +2 nicht verfügbar ist und der Kodierer statt dessen –2 spezifiziert. Daher invertiert der Dekodier-PMQ in diesem Fall das Signal, und auch der Kodierer muß zum Ausgleich das Signal invertieren.
  • Wie schon gesagt, ist es vorteilhaft, zwei nicht korrelierte RPDF-Zittersignale zu haben, um durch Addition und Subtraktion zwei TPDF-Zittersignale zu liefern. Beim MLP-Matrizieren werden die beiden 8-Bit RPDF-Zittersignale, die vom Folgegenerator erhalten werden, auf 24 Bit zeichenerweitert und so behandelt, als ob sie zwei zusätzliche Kanäle wären. Diese Zitterkanäle werden niemals von PMQ modifiziert. Das Zittern in 8 ist wie folgt gegeben: m_coeff[2,4] Dither 0 + m_coeff[2,5] Dither 1
  • Das Zittern ist so wie das als Zittern in 6b identifizierte Zittern. Wenn m_coeff[2,4] und m_coeff[2,5] die gleiche Größe haben, hat das Zittern die gewünschte dreieckige PDF. Bei Verwendung von zwei PMQ, die eine Abwärtsmischung liefern, spezifiziert also der Kodierer m_coeff[2,4] und m_coeff[2,5] mit dem gleichen Vorzeichen in einem PMQ und mit entgegengesetzten Vorzeichen im anderen PMQ, so daß unkorrelierte TPDF-Zittersignale durch das oben beschriebene Rautenzitter-Verfahren hervorgebracht werden.
  • Wenn man in 8 die Eingabesignalabtastwerte als 24-Bit ganze Zahlen betrachtet, haben die Ausgangswerte von den Multiplizierern insgesamt 14 Bit nach dem binären Punkt, weil die Koeffizienten m_coeff[2,j] bis zu 14 Bit nach dem binären Punkt haben können. Für den Moment sei angenommen, daß der Quantisierer Qss einen 24-Bit ganzzahligen Wert quantisiert. Wenn in diesem Fall die beiden 8-Bit RPDF-Zitterwerte in den 24-Bit Wörtern Dither 0 und Dither 1 rechtsbündig gemacht werden, sind die korrekten Größen für m_coeff[2,4] und m_coeff[2,5] beide 2–8.
  • Wenn zum Verringern der Bitrate des Stroms ohne Beeinflussung der Abwärtsmischsignale zusätzliche PMQ verwendet werden, ist es im Kodierer normal, kein Zittern anzuwenden, und infolgedessen sind die m_coeff[i,j] Werte, die zum Multiplizieren der Zitterkanäle in den PMQ benutzt werden, Null. Das läßt vermuten, daß man eine Einsparung machen kann, wenn man die Möglichkeit des Zitterns nicht in allen PMQ vorsieht. Diese Einsparung wird allerdings im Fall von MLP nicht gemacht, da die aus der Regelmäßigkeit der Struktur in praktischen Ausführungsbeispielen erzielten Vorteile die Kosten eines zusätzlichen Multiplikationspaares weit überwiegen.
  • Bei MLP werden die PMQ in Kaskadenanordnung entsprechend 8 sowohl für Matrix 0 als auch für Matrix 1 verwendet. Im Fall von Matrix 1 wäre es normal, daß der Koeffizient des Kanals, der modifiziert wird, im dargestellten Fall m_coeff[2,2], den Wert –2 hat, wenn die LSB-Umgehung benutzt wird, und entweder +1 oder –1, wenn die LSB-Umgehung nicht benutzt wird. Diese Wahl wird vom Kodierer getroffen, und der Koeffizient wird in den Strom eingeschlossen, um vom Dekodierer benutzt zu werden.
  • Bei Verwendung des Zweikanaldekodierers zur Wiederherstellung einer Abwärtsmischung sorgt die Matrix 0 für das Matrizieren und/oder Skalieren der Signale m0 und m1 zur Schaffung von L0 und R0. Dann sind in den PMQ allgemeine Koeffizienten, nicht beschränkt auf Zweierpotenzen, erforderlich. Wiederum sind die Regelmäßigkeit im Dekodierer und die Flexibilität für den Kodierer Gründe, um einheitlich die Architektur gemäß 8 zu wählen.
  • In der Matrix 0 kann das Skalieren des modifizierten Kanals durch Skalieren aller Koeffizienten, mit Ausnahme der Zitterkoeffizienten, die dazu beitragen, erreicht werden. Wenn ein Aufwärtsskalieren erforderlich ist, besteht die Möglichkeit, daß das nötige Skalieren den verfügbaren Koeffizientenbereich von [–2,2] überschreitet, oder daß eine Signalüberlastung innerhalb der Matrixbildung auftritt. Dem kann begegnet werden durch Reduzieren der Skalierung um eine Zweierpotenz und anschließende Anwendung des abschließenden "output_shift" zum Wiederherstellen des gewünschten Pegels.
  • Bei MLP mit Abwärtsmischung ist es nicht normal, die umgangenen LSB im ersten Teilstrom, dem Teilstrom 0, zu führen, da der Abwärtsmischdekodierer sich nicht um eine verlustfreie Wiedergabe bemüht. Der zweite Teilstrom, Teilstrom 1, trägt alle für das Matrizieren des Mehrkanaldekodierers nötigen Informationen, einschließlich der Koeffizienten, des Zitterkeims und der umgangenen LSB, einschließlich jener LSB, die aus den Kanälen ausgeschieden wurden, welche im Teilstrom 0 geführt werden.
  • Ein Merkmal aus 8, das keinen Einfluß auf die obige Beschreibung hat, ist die Tatsache, daß der Quantisierer Qss imstande ist, auf eine Stufengröße zu quantisieren, die eine Zweierpotenz ist, wodurch die Abbruchstelle um ein oder mehr Bit oberhalb des LSB zu liegen kommt. Diese Fähigkeit ist zur Optimierung der Behandlung von Eingabesignalen eingeschlossen, die nicht das oder die niedrigstwertigen Bit des 24-Bit Wortes praktizieren. Bei MLP wird das Merkmal der LSB-Umgehung nur benutzt, wenn die Quantisierungsschrittgröße auf Eins gesetzt ist.
  • Stromintegrität und Verlustfrei-Prüfung
  • Ein verlustbehaftetes Kodiersystem liefert insgesamt eine Ausgabe, bei der es sich nicht um eine genaue Wiederherstellung des eingegebenen Signals handelt. Ein Prüfen der Integrität, zum Beispiel eine zyklische Redundanzprüfung (CRC) oder eine Paritätsprüfung, sollte auf das Prüfen des kodierten Stroms beschränkt sein, so daß Übertragungsfehler markiert werden können. Das Verhältnis zwischen dem Eingabesignal und seiner abschließenden Wiederherstellung ist ein bißchen unbekannt, da es sowohl von inhärenten Verlusten beim verlustbehafteten Kodier- und Dekodierprozeß beeinflußt ist, als auch durch mit der Plattform in Beziehung stehende Fehler, die dadurch verursacht werden, daß sich das arithmetische Verhalten des Dekodierprozessors möglicherweise von dem des Kodierprozessors unterscheidet.
  • Beim MLP wird für jedes Segment des Eingabesignals ein Paritätswort, bekannt als Verlustfreiprüfwert errechnet und in den kodierten Strom eingeschlossen. Es wird erwartet, daß ein Dekodierer ein ähnliches Paritätswort berechnet und anzeigt, daß ein Fehler aufgetreten ist, wenn dieses berechnete Wort nicht mit dem im Strom eingeschlossenen Wort übereinstimmt. Anders als bei den Prüfungen in einem verlustbehafteten Kodiersystem können mit den Prüfungen in einem verlustfreien Kodiersystem Ausfälle gezeigt werden, die auf Überlastung oder sonstiges algorithmisches Versagen innerhalb des Algorithmus, mit der Plattform in Beziehung stehende Unstimmigkeiten und Übertragungsfehler zurückgehen.
  • Im Fall bevorzugter Ausführungsbeispiele kann ein Abspielgerät dem Benutzer über solche Fehler Auskunft geben. So könnte zum Beispiel ein Licht "verlustfrei" aufleuchten, wenn die beiden Prüfwörter übereinstimmen, und ansonsten ausgeschaltet sein. Da ein Ausfall kurzfristig sein könnte, kann eine Impulsstreckschaltung verwendet werden, um dem Benutzer Zeit zu geben, das Versagen zu bemerken. Beispielsweise könnte bei Empfang eines einzigen Versagens das Licht während zwei Sekunden aus bleiben.
  • Bei MLP ist der Verlustfreiprüfwert ein 8-Bit Paritätswort, das für alle Kanäle und alle Abtastwerte innerhalb eines Segmentes von typischerweise 1280 Wörtern berechnet wird. Was die MLP-Spezifikation betrifft, umfaßt dieses Segment alle Abtastwerte zwischen zwei aufeinanderfolgenden "Restart Points". Da MLP von 24-Bit Wörtern ausgeht, würde die Parität natürlich als ein 24-Bit Wort berechnet, aber dieses Paritätswort ist in drei Oktette oder Byte unterteilt, und diese werden zusammen "exclusively-ORed", um den Verlustfreiprüfwert zu liefern. Ehe die Parität berechnet wird, wird jedes 24-Bit Signalwort um eine Bitanzahl gedreht, die der Kanalzahl entspricht. Durch diese Rotation wird ein Problem vermieden, bei dem ein Fehler, der zwei Kanäle identisch beeinflußt, ansonsten unerfaßt bliebe.
  • Gemäß einer Alternative wird die Parität aller Oktette innerhalb jedes Segmentes jedes Kanals benutzt, um ein 8-Bit Paritätsoktett zu erzeugen, und jedes Paritätsoktett wird um seine Kanalzahl gedreht, ehe sie zusammen "exclusively-ORed" werden. Das ist unter Umständen wirtschaftlicher im Fall von Prozessoren, die keine 24-Bit Wortlänge haben.
  • Bei MLP mit einem einzigen Teilstrom bezieht sich der Verlustfreiprüfwert auf das ursprüngliche Signal, welches verlustfrei wiederhergestellt wird. Wenn MLP eine Abwärtsmischung trägt, trägt der zweite Teilstrom den Verlustfreiprüfwert, der sich auf das ursprüngliche Signal bezieht, und das wird von einem Mehrkanaldekodierer geprüft.
  • Im Fall mit Abwärtsmischung trägt der erste Teilstrom auch einen Verlustfreiprüfwert; dieser bezieht sich aber nur auf die Abwärtsmischung. Auch wenn die ausgegebene Abwärtsmischung keine verlustfreie Wiedergabe eines ursprünglichen Signals ist, ist sie doch bestimmbar aufgrund der präzisen Spezifikation der Quantisierungen in der Matrix 0 und der präzisen Spezifikation des Zitterns. Deshalb kann ein Kodierer die Abwärtsmischung bestimmen, die von einem Dekodierer wiederhergestellt wird, und kann den Verlustfreiprüfwert anhand dieser simulierten Abwärtsmischung berechnen. Im Zusammenhang mit der Schaffung eines DVD-Audio-Masters ist beabsichtigt, daß der Kodierer die simulierte Abwärtsmischung zur Probe verfügbar macht, so daß dem Zuhörer versichert werden kann, daß das von seinem Abspielgerät wiederhergestellte Signal Bit für Bit identisch ist mit dem Signal, welches der Master-Ingenieur oder der Produzent der Aufzeichnung gehört hat.
  • Eine Ausnahme ergibt sich im Fall einer Überlastung, die, wie oben erwähnt, normalerweise durch Beschneiden oder Begrenzen im Abspielgerät gehandhabt wird. Da das Verhalten des Beschneidens oder Begrenzens nicht genau festgelegt ist, wird der Verlustfreiprüfwert aus dem Signal unmittelbar vor jeglicher Sättigung oder Begrenzung berechnet. Bei MLP, wo, wie schon gesagt, der Dekodierer einen Verschieber nach dem letzten PMQ beinhaltet und das Beschneiden dadurch verwirklichen kann, daß er einen Akkumulator in den Speicher unter Anwendung von Sättigungsarithmetik einspeichert, kann die Verlustfreiprüfung unmittelbar aus dem Wert im Akkumulator berechnet werden, worauf die Sättigung folglich keinen Einfluß hat.
  • Manchmal kann, wie 9 zeigt, einem verlustfreien Kodierer ein Vorquantisierer vorausgehen, um die übertragene Datenrate zu verkleinern. Weitere Information hinsichtlich der Vorquantisierung ist aus AES 1997 und AES 1998, den oben genannten Veröffentlichungen, zu entnehmen. Unter diesen Umständen ist die Wiedergabe des vom Vorquantisierer empfangenen, ursprünglichen Signals nicht verlustfrei, aber die Wiedergabe des vorquantisierten Signals ist verlustfrei. Wiederum sollte das vorquantisierte Signal zur Probe bereitgestellt werden, und der Verlustfreiprüfwert sollte aus dem vorquantisierten Signal berechnet werden, damit dem Zuhörer versichert werden kann, daß das von seinem Abspielgerät wiedergewonnene Signal Bit für Bit identisch mit dem Signal ist, welches im Stadium der Schaffung des Masters zur Probe angehört oder mindestens zur Probe verfügbar war.
  • Strategien zur Wahl der Kodierermatrix
  • Um eine Zweikanalabwärtsmischung zu kodieren, müssen die Signale m0 und m1 in dem Teilraum sein, den die Abwärtsmischkanäle L0 und R0 umfassen. Innerhalb dieses Kriteriums ist zwar die Flexibilität beträchtlich, aber einige Wahlmöglichkeiten sind besser als andere. So sollte der Kodierer aus verschiedenen Gründen vermeiden, m0 und m1 so zu wählen, daß sie nahezu linear abhängig sind. Erstens hätte die Matrix 0 dann wahrscheinlich große Koeffizienten, und die Wiederherstellung aus dem Abwärtsgemisch wäre rauschbehaftet. Zweitens würde der Kodierer beim Lösen der Gleichungen, um die in der Matrix 1 enthaltenen PMQ zu bestimmen, vermutlich Koeffizienten erzeugen, die größer wären als der zulässige Bereich. Drittens beeinträchtigt das Matrizieren der Signale die Datenrate für die verlustfreie Kompression und ist wenig wirksam zum getrennten Übertragen von Signalen, die einander sehr ähnlich sind.
  • Wie schon erwähnt, besteht eine Möglichkeit zur Vermeidung der schlimmsten dieser Probleme darin, m0 und m1 so zu wählen, daß sie zueinander orthogonal sind. Das bedeutet, daß m0 und m1, ausgehend von den Eingabesignalen, von einer Matrix bestimmt sind, deren Reihen orthogonal zueinander sind. Bei diesem Kriterium verbleibt noch ein wenig Flexibilität, die beispielsweise so gelöst werden könnte, daß m0 proportional zu L0 gewählt würde. Es sei zum Beispiel die folgende Abwärtsmischspezifikation betrachtet:
  • Figure 00240001
  • Hier ist der größte, zu L0 beitragende Koeffizient der von Lf, der einen Wert von 0.75 hat. Wenn also m0 = L0 generiert wird, ergibt sich, skaliert um 1/0.75 = 1.333
    Figure 00240002
    was mit einem PMQ verwirklicht werden kann, der den ersten Kanal unmodifiziert läßt.
  • Das Signal m-1 muß eine lineare Kombination aus L0 und R0 sein. Eine lineare Kombination, die orthogonal zu L0 und folglich auch orthogonal zu m0 ist, ergibt sich durch m1(unscaled) = R0 – λL0,wobei
    Figure 00240003
    und das Symbol bezeichnet das skalare oder Punktprodukt von zwei Vektoren.
  • Der resultierende Wert ist gleichwertig zur Hernahme der Punktprodukte der Reihenvektoren in der Abwärtsmischmatrix. Wenn man zum Bezeichnen der Abwärtsmischmatrix downmix nimmt, kann das skalare λ wie folgt ausgedrückt werden
    Figure 00240004
    worin downmix1 den ersten Reihenvektor der Matrix und
    downmix2 den zweiten Reihenvektor der Matrix bezeichnet und bei Anwendung der Abwärtsmischmatrix aus dem oben gezeigten Beispiel: λ = 0.1849. Deshalb
  • Figure 00250001
  • Der m1 generierende zweite PMQ empfängt die vom ersten PMQ bereitgestellten Signale, deren erster Kanal m0 statt Lf ist. Deshalb muß m1, was m0, Rf usw. betrifft, neu ausgedrückt werden.
  • Figure 00250002
  • Hier multipliziert 0.8000, der größte Koeffizient, Rs, den vierten Eingangskanal. Aus diesem Grund wird eine Permutation angewandt, wie schon gesagt, um den zweiten und vierten Eingangskanal auszutauschen und dadurch Rs an die zweite Stelle zu bringen, so daß m1 in der Matrixausgabe an zweiter Stelle erscheint.
  • Figure 00250003
  • Schließlich wird so skaliert, daß der Koeffizient von Rs Eins ist.
  • Figure 00260001
  • Das ist jetzt die korrekte Form für die Verwirklichung mittels eines zweiten PMQ.
  • Das obige Beispiel zeigt nur eine von mehreren Strategien, die ein Kodierer verfolgen kann. Eine einfachere Strategie besteht darin, m0 wie vorstehend zu berechnen, dann m1, abgesehen vom Skalieren, durch Subtrahieren eines Anteils 1 von L0 von R0 zu bestimmen, so daß der Koeffizient von Lf Null ist. Bei diesem speziellen Beispiel hat die Spärlichkeit der ursprünglichen Abwärtsmischspezifikation zur Folge, daß diese Bedingung mit λ = 0 erfüllt ist.
  • Figure 00260002
  • Der Wert Null des ersten Koeffizienten macht es unnötig, beim Berechnen des zweiten PMQ die Auswirkung des ersten PMQ zu berücksichtigen. Mit anderen Worten, m0 kann benutzt werden, um in der obigen Gleichung L-f zu ersetzen, ohne daß eine weitere Änderung gemacht wird. Wenn, wie schon gesagt, skaliert und permuttiert wird, ist folgendes zu erhalten:
  • Figure 00260003
  • Das hat die richtige Form zur Verwirklichung mit dem zweiten PMQ.
  • Zwar wird mit dem obigen vereinfachten Verfahren keine Orthogonalität erreicht, aber es wird vermieden, daß m0 und m1 erzeugt werden, die nahezu linear abhängig sind, wenn zum Beispiel L0 und R0 selbst fast linear abhängig wären. Die Möglichkeit, daß L0 und R0 tatsächlich linear abhängig sind (das heißt skalierte Versionen voneinander sind), muß geprüft und als ein Sonderfall behandelt werden.
  • Als Alternative kann in einem fortschrittlicheren Kodierer die obige Bedingung der Orthogonalität durch die Bedingung ersetzt werden, daß die Kreuzkorrelation der Signale m0 und m1 ungefähr Null sein sollte. Diese Bedingung läßt sich durch eine geeignete Wahl von λ erfüllen. Die Bedingung der Kreuzkorrelation Null minimiert die Energie in m1, und bei Fehlen einer Frequenzabhängigkeit hätte dies die Wirkung, die übertragene Datenrate auf ein Minimum einzuschränken. Wie in der Veröffentlichung WO-A 96/37048 beschrieben, ist die Datenrate bei Vorhandensein einer spektralen Variation stärker vom Informationsgehalt als von der Energie abhängig. Bei typischen Tonsignalen wird die Energie und Kreuzkorrelation von großen niederfrequenten Signalen dominiert, die wegen ihrer geringen Bandbreite nur wenig Informationsinhalt haben. Deshalb ist es besser, eine spektrale Gewichtung, die typischerweise hohe Frequenzen hervorhebt, vorzunehmen, ehe die Kreuzkorrelation berechnet wird. Ideal ist es, die spektrale Gewichtung an das Signal selbst anzupassen; aber es ist kompliziert, eine optimale oder nahezu optimale Gewichtung festzulegen, und in der Praxis reicht eine festgelegte Gewichtung aus. Ein digitaler Filter, dessen z-Transformation (1 – z–1 )2 ist, hat zum Beispiel einen Frequenzgang, der mit 12 dB pro Oktave über den niedrigen und mittleren Frequenzteil des Tonfrequenzbandes ansteigt, und das reicht im allgemeinen aus, um eine unmäßige Beherrschung durch große niederfrequente Signale zu unterdrücken.
  • Laut Offenbarung in WO-A 96/37048 sind die bevorzugten Richtungen der übertragenen Signale die Eigenvektoren einer Matrix, die bei fehlender Frequenzabhängigkeit die Korrelationsmatrix der Signale wären. Eine solche Wahl würde zu einer Null-Korrelation zwischen den übertragenen Signalen führen. Aber die Berechnung von Eigenvektoren ist zeitraubend, und das oben umrissene Verfahren, bei dem die Null-Korrelation einfach durch Subtraktion erhalten wird, bringt eine Datenrate hervor, die sich theoretisch nur wenig von der unterscheidet, die das Resultat einer Eigenvektorberechnung ist.
  • Das obige Verfahren zur Wahl der Richtungen der übermittelten Signale kann auch allgemein angewandt werden, das heißt auf Kodierer, die keine Abwärtsmischung berechnen, oder auch auf die Verarbeitung der verbleibenden Kanäle, sobald eine Abwärtsmischung extrahiert wurde.
  • Es wird nun ein Verfahren beschrieben, bei dem die Vektorrichtungen der übertragenen Kanäle einzeln der Reihe nach gewählt werden. Es wird ein erster Eingangskanal gewählt, und weitere Kanäle werden davon subtrahiert mit Koeffizienten, die so gewählt sind, daß die Energie in dem nach der Subtraktion verbleibenden Signal minimal ist. Die Subtraktion wird von einem primitiven Matrixquantisierer durchgeführt, der ein Ausgangssignal liefert. Dann wird ein weiterer Eingangskanal gewählt, und wiederum werden die übrigen Kanäle mittels eines PMQ subtrahiert. Der PMQ liefert das nächste Ausgangssignal, und seine Koeffizienten sind so gewählt, daß die Energie darin auf ein Minimum begrenzt ist. Das Verfahren wird wiederholt, bis alle Eingangskanäle verarbeitet oder alle verfügbaren PMQ benutzt wurden oder bis entschieden wird, daß es sich nicht lohnt, weitere Matrixtransformationen vorzunehmen. Jegliche weiteren Eingangskanäle, die nicht mittels PMQ modifiziert wurden, werden dann ohne Modifikation zum Ausgang weitergeleitet.
  • Eine Verbesserung dieses Verfahrens bestünde darin, die Subtraktion so zu wählen, daß ein Maß an Entropie oder Informationsgehalt des Signals statt der Energie allein minimiert wird. Gemäß WO-A 96/37048 wurde die Entropie geschätzt, indem das Integral über der Frequenz des Logarithmus des Spektrums genommen wurde, und es wäre absolut möglich, jede Minimierung im Hinblick auf dieses Kriterium zu berechnen. Das Minimieren spektral gewichteter Energie wäre eine weniger rechenintensive Alternative, und es gibt verschiedene Wege, eine angemessene spektrale Gewichtung in Abhängigkeit vom Signal zu berechnen. Noch wirtschaftlicher wäre es, eine Gewichtung mit fester Frequenz vorzunehmen, wie beispielsweise von einem digitalen Filter mit z-Transformation geboten (1 – z–1)2.
  • Für den Fachmann auf dem Gebiet der numerischen Matrixalgebra ist erkennbar, daß das obige Verfahren der Anwendung der Gram-Schmidt-Orthogonalisierung zur Schaffung eines orthogonalen Vektorsatzes etwas verwandt ist. Bei Betrachtung der Subtraktion könnte man es per Analogie für unnötig halten, Vektoren einzuschließen, die bereits verarbeitet wurden, denn diese sind kraft ihrer Konstruktion orthogonal zu den noch nicht verarbeiteten Vektoren. Das ist jedoch nicht allgemeingültig, wenn eine Abwärtsmischung kodiert wird, und es trifft auch nicht zu, wenn die Minimierung die Entropie statt die Energie betrifft. Insgesamt wird also jeder PMQ beide Signale, die bereits verarbeitet wurden, und Eingangskanäle, die noch verarbeitet werden müssen, subtrahieren.
  • Die Reihenfolge, in der Kanäle zur Modifizierung gewählt werden, ist bisher als willkürlich erachtet worden. Die Reihenfolge kann in vielen Fällen tatsächlich geringe Auswirkung auf die endgültige Datenrate haben, sie kann aber die Größe der Koeffizienten bei der Subtraktion wesentlich beeinflussen. Da MLP die Koeffizienten auf einen maximalen Wert von 2 einschränkt, ist dies eine wichtige Überlegung. Wenn die Minimierung die Energie betrifft oder Energie mit fester spektraler Gewichtung, ist dies rechenmäßig extrem schnell, und daher ist es absolut möglich, eine willkürliche Auswahl auf Versuchsbasis zu treffen und sie zu verwerfen, und eine andere zu versuchen, wenn die Koeffizienten zu groß sind. Eine weitere Heuristik besteht darin, einen Kanal zur Modifikation auszuwählen, dessen Energie oder spektral gewichtete Energie am kleinsten ist.
  • Wenn der PMQ so verwirklicht wird, wie in 8 gezeigt, wäre es normal, einen Koeffizienten von +1 oder –1 für den zu modifizierenden Kanal zu wählen. Wenn mit der Subtraktion Signale erzeugt werden, die Überlastung hervorrufen, kann der Koeffizient verkleinert werden. Es wäre bei MLP normal, ihn bis auf –0.5 zu verkleinern, wozu das oben beschriebene LSB-Umgehungsverfahren angewandt wird. Hiermit wird ein zusätzlicher Raum von 6 dB geschaffen, der normalerweise ausreicht. Ist das nicht der Fall, gibt es verschiedene Möglichkeiten. Die gegenwärtig betrachtete Matrixtransformation kann abgewandelt oder aufgegeben werden, was bedeutet, daß der Eingangskanal ohne Modifikation übermittelt werden kann. Oder für den Fall, daß ein weiterer PMQ verfügbar ist, kann auch dieser zur LSB-Umgehungsoperation ausgelegt und dem in Betracht gezogenen Kanal zugeordnet werden, was eine weitere Vergrößerung des Kopfraums um 6 dB ermöglicht. Der zusätzliche PMQ tritt vor dem PMQ in Aktion, der die Subtraktion verwirklicht. Da der zusätzliche PMQ allein zum Verkleinern der Signalamplitude nötig ist, wendet er bei MLP normalerweise einen Koeffizienten von –0.5 auf den zu modifizierenden Kanal an und hat ansonsten Null-Koeffizienten.
  • Ein Sonderfall, bei dem zwei oder sogar drei PMQ zum Verarbeiten eines Kanals erforderlich sein können, ist der Fall, bei dem eine Abwärtsmischspezifikation mehrere Koeffizienten von im wesentlichen der gleichen Größe hat. Obgleich zum Beispiel alle Koeffizienten bei dem PMQ, der in dem obigen Beispiel m0 liefert, weniger sind als Eins, ist die Summe absoluter Größen der Koeffizienten 2.627. Selbst wenn also der m0 liefernde PMQ mit LSB-Umgehung arbeitet und den Kanal um 0.5 skaliert, besteht immer noch die Möglichkeit einer Zunahme der Signalgröße um einen Faktor 1.313. Das kann bei einer gegebenen Abtastperiode dann passieren, wenn die Kanäle der Eingabe gleichzeitig volle Modulation erreichen und jeder das gleiche Vorzeichen wie sein Koeffizient im PMQ hat oder wenn jeder das entgegengesetzte Vorzeichen wie sein Koeffizient hat. Eine Überlastung kann durch Zuteilung eines zusätzlichen PMQ vermieden werden, der vor dem PMQ, der m0 liefert, einen LSB-Bypass verwirklicht.
  • Aus Gründen der Klarheit sind in der vorstehenden Beschreibung nur die PMQ erwähnt, die der Kodierer verwirklicht. Es liegt auf der Hand, daß für jeden PMQ, den er benutzt, der Kodierer auch einen entsprechenden PMQ spezifizieren muß, der vom verlustfreien Dekodierer in der Matrix 1 zu benutzen ist, und daß die PMQ des Dekodierers in umgekehrter Reihenfolge angewandt werden müssen. Im Fall eines LSB-Bypass impliziert ein Kodierer-PMQ, der auf den zu modifizierenden Kanal einen Koeffizienten von –0.5 anwendet, einen Dekodierer-PMQ, der auf diesen Kanal einen Koeffizienten von –2.0 anwendet. Im Fall des Abwärtsmischens muß der Kodierer die Koeffizienten für die Matrix 0 in Abhängigkeit von der für m0 und m1 getroffenen Wahl spezifizieren. Falls ein Kanal skaliert wurde, muß außerdem der Skalierungsfaktor bei der Berechnung der anschließenden Abwärtsmischkoeffizienten, die den Kanal multiplizieren, berücksichtigt werden.
  • Kodieren von Inhalten gemischter Rate
  • Die DVD-Audiospezifikation erlaubt es, Aufzeichnungen auf der Platte mit zwei Abtastfrequenzen durchzuführen. So können beispielsweise die vorderen Kanäle Lf, Rf mit einer Abtastrate von 96 kHz kodiert werden, während die übrigen Kanäle mit 48 kHz kodiert werden können, um die Datenrate zu verringern. Aber die vorstehende Beschreibung der gleichzeitigen Übertragung von Abwärtsmischinformation im ersten Teilstrom geht davon aus, daß alle Kanäle gleichzeitig abgetastet werden, und insbesondere mit der gleichen Abtastrate.
  • In dem Artikel von P. G. Craven, M. J. Law J. R. und Stuart "Lossless Compression using IIR Prediction Filters', J. Audio Eng. Soc., Abstracts, März 1997, Band 45, Nr. 5, S. 404, Vorabdruck Nr. 4415 wird erklärt, daß es bei Anwendung verlustfreier Kompression nicht nötig ist, die Abtastrate zu verringern, um Daten zu sparen. Es reicht, die Bandbreite des Signals zu begrenzen, weil der verlustfreie Kodierer automatisch auf den verringerten Informationsinhalt des Signals anspricht und es auf eine niedrigere Bitrate kodiert.
  • Ein aufwärts abgetastetes Signal hat von Natur aus eine begrenzte Bandbreite. So hat beispielsweise ein 96 kHz abgetastetes Signal die Fähigkeit, Frequenzen bis zu fast 48 kHz wiederzugeben; aber ein solches Signal hat sehr wenig Energie oberhalb 24 kHz, wenn es durch Aufwärtsabtasten eines 48 kHz abgetasteten Signals abgeleitet ist. Wenn daher die verlustfreie Kompression auf Material gemischter Rate angewandt wird, ist es ohne nennenswerte nachteilige Auswirkung auf die Datenrate möglich, beliebige Kanäle aufwärts abzutasten, die mit niedrigerer Rate vorliegen, zum Beispiel 48 kHz, ehe kodiert wird. Es werden also alle Kanäle mit der gleichen Abtastrate, zum Beispiel 96 kHz kodiert. Diese vereinheitlichte Abtastrate ermöglicht die zur Verwirklichung der Erfindung nötigen Matrixoperationen.
  • In der Literatur über digitale Signalverarbeitung ist "Aufwärtsabtasten" auch bekannt als "Interpolation", und die Techniken zum Durchführen derselben sind allgemein bekannt. 10 zeigt einen Kodierer, der zum Einschluß dieses Merkmals geeignet ist. Da mit dem Filtern eine Verzögerung einhergeht, wird den Kanälen Lf und Rf, die keine Aufwärtsabtastung brauchen, eine Ausgleichsverzögerung gegeben.
  • Das Interpolationsfiltern ist insgesamt nicht verlustfrei, aber bei einem bevorzugten Ausführungsbeispiel sind die Aufwärtsabtast-Filter gemäß 10 von der als Halbbandfilter bekannten Art. Wenn Halbbandfilter zur Interpolation herangezogen werden, liefern sie eine Ausgabe mit doppelt so vielen Abtastpunkten wie die eingegebenen Abtastpunkte. Die geradzahligen Ausgabepunkte entsprechen den Eingabepunkten und enthalten mit den Eingabewerten identische Abtastwerte, während die ungeradzahligen Ausgabepunkte halbwegs zwischen den Eingabewerten liegen und interpolierte Werte enthalten.
  • Wenn ein Strom auf diese Weise kodiert ist, hat das Abspielgerät zwei Dinge zur Wahl. Es kann den Strom so abspielen, als ob alle Kanäle ursprünglich mit 96 kHz abgetastet worden wären und ignoriert damit die unterschiedliche Herkunft der geraden und ungeraden Abtastwerte. Das Abspielgerät kann alternativ im Fall von Kanälen, die dem Kodierer ursprünglich mit 48 kHz vorgelegt wurden, aber auch nur die geraden Abtastwerte auswählen. In diesem Fall hat das Abspielgerät Zugang zu einer verlustfreien Wiederherstellung des Inhalts mit gemischter Rate, der dem Kodierer vorgelegt wurde. Um dies möglich zu machen, muß der kodierte Strom eine Spezifikation darüber, welche Kanäle ursprünglich mit der niedrigeren Abtastrate präsentiert wurden, sowie einen Hinweis darauf enthalten, welche Abtastwerte als gerade und welche als ungerade zu betrachten sind. Letzteres kann impliziert sein, wenn der Strom eine Blockstruktur enthält, bei der die Anzahl Abtastwerte in einem Block immer gerade ist. Auf DVD-Audio bietet die Verwendung von "Zugangseinheiten" und "Präsentationseinheiten" eine solche Struktur.
  • Die DVD-Audiospezifikation sorgt auf ähnliche Weise für einen Inhalt gemischter Rate mit 88,2 kHz und 44,1 kHz. Das oben beschriebene Kodiermerkmal mit gemischter Rate kann auch auf ähnliche Weise auf diesen Fall angewandt werden.
  • Verwirklichung
  • Die zum Durchführen verschiedener Aspekte der Erfindung erforderlichen Funktionen können von Komponenten durchgeführt werden, die auf die verschiedenste Weise implementiert sind, einschließlich diskreter logischer Bauelemente, einer oder mehr ASIC und/oder programmgesteuerter Prozessoren. Die Art, wie diese Bauelemente verwirklicht sind, hat keine kritische Bedeutung. So können beispielsweise Vorgänge, die erforderlich sind, um diese Aspekte der Erfindung in die Tat umzusetzen, in einer Vorrichtung verwirklicht werden, die einen oder mehr Anschlüsse für den Empfang und das Senden von digitale Information wiedergebenden Signalen aufweisen, ferner Direktzugriffspeicher zum Speichern der digitalen Information, einen Träger zum Aufzeichnen eines oder mehrerer Befehlsprogramme und einen Prozessor, der die Befehlsprogramme ausführt. Die Befehlsprogramme können mit einer Vielfalt an maschinenlesbaren Trägern und sonstigen Fertigungsprodukten aufgezeichnet sein, einschließlich verschiedener Arten von Festwertspeichern, Magnetbändern, Magnetplatten, Bildplatten, oder sie können mittels eines Basisbandes oder modulierter Kommunikationswege über das gesamte Spektrum von Überschall- bis zu Ultraviolettfrequenzen übermittelt werden.
  • Verschiedene Merkmale der Kodier- und Dekodierverfahren und Vorrichtungen sind vorstehend beschrieben worden. Es sei darauf hingewiesen, daß vorgesehen ist, diese Merkmale, sofern sie getrennt verwirklicht werden können, zu kombinieren, um die von diesen Merkmalen gebotenen, verschiedenen Vorteile zu nutzen.

Claims (15)

  1. Dekodierverfahren, aufweisend: Erhalten einer Anzahl N Eingangskanalsignale; Transformieren der Eingangskanalsignale mit einer Matrix, die als Kaskade primitiver Matrixquantisierer verwirklicht ist, um eine Anzahl N Matrixausgangskanalsignale zu schaffen; und Ordnen einer Anzahl N Dekodierausgangskanalsignale, als Reaktion auf die Matrixausgangskanalsignale, in Abhängigkeit von Kanalordnungsinformation, die von den Eingangskanalsignalen abgeleitet ist.
  2. Verfahren nach Anspruch 1, bei dem das Ordnen nach dem Transformieren durchgeführt wird.
  3. Verfahren nach Anspruch 1, bei dem das Ordnen vor dem Transformieren durchgeführt wird.
  4. Verfahren nach einem der Ansprüche 1 bis 3, bei dem die Eingangskanalsignale Kanalsignale links vorn, rechts vorn, links rundum, rechts rundum, Mitte und niederfrequente Effekte eines Sechskanal-Audiosystems darstellen.
  5. Verfahren nach einem der Ansprüche 1 bis 4, bei dem einer der primitiven Matrixquantisierer in der Kaskade aus primitiven Matrixquantisierern ein erster primitiver Matrixquantisierer ist, der ein erstes Kanalsignal verarbeitet, welches eine Reaktion auf eines der Eingangskanalsignale ist, wobei das Verfahren aufweist: Multiplizieren des ersten Kanalsignals innerhalb des ersten primitiven Matrixquantisierers mit einem Verstärkungskoeffizienten, der von den Eingangskanalsignalen erhalten wurde; und Kombinieren des multiplizierten ersten Kanalsignals mit einem oder mehr niedrigstwertigen Bits, die von den Eingangskanalsignalen erhalten wurden.
  6. Kodierverfahren, aufweisend: Erhalten einer Anzahl N Eingangskanalsignale; Transformieren der Eingangskanalsignale mit einer Matrix, die als Kaskade primitiver Matrixquantisierer verwirklicht ist, um eine Anzahl N Matrixausgangskanalsignale zu schaffen; Ordnen einer Anzahl N Kodierausgangskanalsignale, als Reaktion auf die Matrixausgangskanalsignale, in Abhängigkeit von Kanalordnungsinformation; und Erzeugen einer Vielzahl von Teilströmen, die Informationen übermitteln, welche die Kodierausgangskanalsignale und die Kanalordnungsinformation darstellen, wobei ein erster Teilstrom einen strengen Teilsatz der Matrixausgangskanalsignale wiedergibt und eine Abwärtsmischspezifikation enthält.
  7. Verfahren nach Anspruch 6, welches die Kanalordnungsinformation aus der Abwärtsmischspezifikation ableitet.
  8. Verfahren nach Anspruch 7, welches die Kanalordnungsinformation so ableitet, daß ein Kanalsignal, welches den größten Koeffizienten in der Abwärtsmischspezifikation hat, so angeordnet wird, daß es ein erstes Kanalsignal ist, welches in dem ersten Teilstrom wiedergegeben wird.
  9. Verfahren nach einem der Ansprüche 6 bis 8, welches einen primitiven Matrixquantisierer in der Kaskade primitiver Matrixquantisierer anwendet, um ein Kanalsignal zu modifizieren, welches in einem zweiten Teilstrom der Vielzahl von Teilströmen wiedergegeben ist, so daß der zweite Teilstrom verlustfrei komprimiert wird.
  10. Verfahren nach einem der Ansprüche 6 bis 9, bei dem einer der primitiven Matrixquantisierer in der Kaskade primitiver Matrixquantisierer ein erster primitiver Matrixquantisierer ist, der ein erstes Kanalsignal verarbeitet, welches eine Reaktion auf eines der Eingangskanalsignale ist, wobei das Verfahren aufweist: Multiplizieren des ersten Kanalsignals innerhalb des ersten primitiven Matrixquantisierers mit einem Verstärkungskoeffizienten; und Erzeugen der Vielzahl von Teilströmen unter Einschluß des Verstärkungskoeffizienten und eines oder mehr niedrigstwertiger Bits über eine Anzahl von dem ersten Kanal zugeordneten Bits hinaus, die aus der Multiplikation des ersten Kanalsignals resultieren.
  11. Von einer Maschine lesbarer Träger, der ein Befehlsprogramm übermittelt, das von der Machine zur ausführbar ist, um das Verfahren gemäß einem der Ansprüche 1 bis 10 durchzuführen.
  12. Vorrichtung mit Einrichtungen zum Durchführen des Verfahrens gemäß einem der Ansprüche 1 bis 10.
  13. Vorrichtung nach Anspruch 12 mit einem Träger, auf dem ein Befehlsprogramm gespeichert ist, und einem mit dem Träger gekoppelten Prozessor zum Ausführen des Befehlsprogramms, um das Verfahren durchzuführen.
  14. Informationsträger, dessen Information als eine Vielzahl von Teilströmen formatiert ist, die eine Vielzahl von Kanalsignalen wiedergeben, welche mittels einer Matrixtransformation kodiert sind, die eine Vielzahl von Matrixausgangskanalsignalen hat, wobei ein erster Teilstrom in der Vielzahl von Teilströmen einen strengen Teilsatz der Matrixausgangskanalsignale wiedergibt und eine Abwärtsmischspezifikation enthält, und wobei die vom Träger getragene Information ferner Information aufweist, die eine Reihenfolge der Kanalsignale übermittelt, die in der Vielzahl von Teilströmen wiedergegeben sind.
  15. Träger nach Anspruch 14, bei dem die Information auf dem Träger einen Verstärkungskoeffizienten, Information in einem ersten Kanalsignal, multipliziert mit dem Verstärkungskoeffizienten, und ein oder mehr niedrigstwertige Bits des ersten Kanalsignals, aus dem multiplizierten ersten Kanalsignal resultierend, aufweist, die eine Anzahl dem ersten Kanal zugeordneter Bits übersteigen.
DE60006953T 1999-04-07 2000-04-07 Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen Expired - Lifetime DE60006953T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB9907919 1999-04-07
GBGB9907918.8A GB9907918D0 (en) 1999-04-07 1999-04-07 Lossless packing
GBGB9907919.6A GB9907919D0 (en) 1999-04-07 1999-04-07 Lossless packing
GB9907918 1999-04-07
PCT/GB2000/001308 WO2000060746A2 (en) 1999-04-07 2000-04-07 Matrixing for losseless encoding and decoding of multichannels audio signals

Publications (2)

Publication Number Publication Date
DE60006953D1 DE60006953D1 (de) 2004-01-15
DE60006953T2 true DE60006953T2 (de) 2004-10-28

Family

ID=26315389

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60006953T Expired - Lifetime DE60006953T2 (de) 1999-04-07 2000-04-07 Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen

Country Status (15)

Country Link
US (3) US6611212B1 (de)
EP (4) EP2391146A3 (de)
JP (1) JP4610087B2 (de)
KR (1) KR100915120B1 (de)
AR (1) AR023424A1 (de)
AT (1) ATE255785T1 (de)
AU (1) AU781629B2 (de)
CA (3) CA2742649C (de)
DE (1) DE60006953T2 (de)
DK (1) DK1173925T3 (de)
ES (1) ES2208297T3 (de)
MY (2) MY123651A (de)
SG (2) SG2012056305A (de)
TW (1) TWI226041B (de)
WO (1) WO2000060746A2 (de)

Families Citing this family (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0001727L (sv) * 2000-05-10 2001-11-11 Global Ip Sound Ab Överföring över paketförmedlade nät
JP2001314181A (ja) * 2000-05-10 2001-11-13 Mi Tec:Kk キレート化合物含有酒類
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7451006B2 (en) * 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
US20020191522A1 (en) * 2001-05-07 2002-12-19 Media Tek, Inc. DVD audio encoder and decoder
US7447321B2 (en) 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US6804565B2 (en) 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
CN100364234C (zh) * 2001-11-29 2008-01-23 联发科技股份有限公司 声讯的播放系统与无失真压缩编码系统
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
CA2773294C (en) * 2002-05-03 2013-03-12 Harman International Industries, Incorporated Sound detection and localization system
US6935959B2 (en) * 2002-05-16 2005-08-30 Microsoft Corporation Use of multiple player real-time voice communications on a gaming device
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
WO2005053354A1 (en) * 2003-11-27 2005-06-09 Yul Anderson Vsr surround tube headphone
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2005215162A (ja) * 2004-01-28 2005-08-11 Dainippon Printing Co Ltd 音響信号の再生装置
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
RU2382419C2 (ru) * 2004-04-05 2010-02-20 Конинклейке Филипс Электроникс Н.В. Многоканальный кодер
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
KR100918741B1 (ko) * 2004-07-27 2009-09-24 삼성전자주식회사 이동 통신 시스템에서 채널 부호화 장치 및 방법
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
RU2407068C2 (ru) * 2004-11-04 2010-12-20 Конинклейке Филипс Электроникс Н.В. Многоканальное кодирование и декодирование
US8340306B2 (en) * 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (de) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametrische kombinierte Kodierung von Audio-Quellen
DE102005014477A1 (de) * 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
EP1866912B1 (de) 2005-03-30 2010-07-07 Koninklijke Philips Electronics N.V. Mehrkanal-audiocodierung
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126859A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
US8917874B2 (en) * 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US7958424B2 (en) * 2005-06-22 2011-06-07 Trident Microsystems (Far East) Ltd. Multi-channel LDPC decoder architecture
JP2009500657A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
EP1946294A2 (de) * 2005-06-30 2008-07-23 LG Electronics Inc. Vorrichtung zum codieren und decodieren von audiosignalen und verfahren dafür
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7987097B2 (en) * 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
AU2006285538B2 (en) * 2005-08-30 2011-03-24 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007027056A1 (en) 2005-08-30 2007-03-08 Lg Electronics Inc. A method for decoding an audio signal
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7770090B1 (en) 2005-09-14 2010-08-03 Trident Microsystems (Far East) Ltd. Efficient decoders for LDPC codes
US8319791B2 (en) * 2005-10-03 2012-11-27 Sharp Kabushiki Kaisha Display
KR100857115B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
EP1946302A4 (de) 2005-10-05 2009-08-19 Lg Electronics Inc Verfahren und vorrichtung zur signalverarbeitung und codierungs- und decodierungsverfahren und vorrichtung dafür
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
WO2007043388A1 (ja) * 2005-10-07 2007-04-19 Matsushita Electric Industrial Co., Ltd. 音響信号処理装置および音響信号処理方法
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US20080262853A1 (en) * 2005-10-20 2008-10-23 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US7716043B2 (en) * 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
EP1946310A4 (de) * 2005-10-26 2011-03-09 Lg Electronics Inc Verfahren zum codieren und decodieren eines mehrkanal-audiosignals und vorrichtung dafür
JP4806031B2 (ja) * 2006-01-19 2011-11-02 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US9306852B2 (en) * 2006-01-27 2016-04-05 Avaya Inc. Coding and packet distribution for alternative network paths in telecommunications networks
KR100983286B1 (ko) * 2006-02-07 2010-09-24 엘지전자 주식회사 부호화/복호화 장치 및 방법
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
ATE539434T1 (de) 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
US20080175137A1 (en) * 2007-01-23 2008-07-24 Mediatek Inc. Method for encoding data written to optical storage media
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
BRPI0816556A2 (pt) 2007-10-17 2019-03-06 Fraunhofer Ges Zur Foerderung Der Angewandten Forsschung E V codificação de áudio usando downmix
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101158096B1 (ko) * 2008-11-18 2012-06-22 삼성전자주식회사 다중 송수신 안테나 시스템에서 서로 다른 변조 차수를 갖는 복수의 레이어의 재정렬 방법, 신호 검출 방법 및 그 수신 장치
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
EP2483887B1 (de) * 2009-09-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mpeg-saoc audiosignaldecoder, verfahren zum bereitstellen einer upmix-signaldarstellung unter verwendung einer mpeg-saoc decodierung und computerprogramm unter verwendung eines zeit-/frequenz-abhängigen gemeinsamen inter-objekt-korrelationsparameterwertes
US9305550B2 (en) * 2009-12-07 2016-04-05 J. Carl Cooper Dialogue detector and correction
US9138178B2 (en) * 2010-08-05 2015-09-22 Ace Communications Limited Method and system for self-managed sound enhancement
KR101756838B1 (ko) * 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
EP2477188A1 (de) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codierung und Decodierung von Slot-Positionen von Ereignissen in einem Audosignal-Frame
JP5719966B2 (ja) 2011-04-08 2015-05-20 ドルビー ラボラトリーズ ライセンシング コーポレイション 2つのエンコードされたビットストリームからのオーディオストリームの混合において使用するためのメタデータの自動設定
CN107025909B (zh) 2011-10-21 2020-12-29 三星电子株式会社 能量无损编码方法和设备以及能量无损解码方法和设备
GB2524424B (en) 2011-10-24 2016-04-27 Graham Craven Peter Lossless buried data
EP2815399B1 (de) * 2012-02-14 2016-02-10 Huawei Technologies Co., Ltd. Verfahren und vorrichtung zur durchführung einer adaptiven abwärts- und aufwärtsmischung eines mehrkanal-audiosignals
ITTO20120274A1 (it) * 2012-03-27 2013-09-28 Inst Rundfunktechnik Gmbh Dispositivo per il missaggio di almeno due segnali audio.
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
WO2013192111A1 (en) 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
EP2873073A1 (de) * 2012-07-12 2015-05-20 Dolby Laboratories Licensing Corporation Dateneinbettung in stereoaudio mittels sättigungsparametermodulation
AU2013298462B2 (en) * 2012-08-03 2016-10-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Decoder and method for multi-instance spatial-audio-object-coding employing a parametric concept for multichannel downmix/upmix cases
WO2014035864A1 (en) 2012-08-31 2014-03-06 Dolby Laboratories Licensing Corporation Processing audio objects in principal and supplementary encoded audio signals
JP6194023B2 (ja) 2013-02-14 2017-09-06 ハワード エム シンガーSINGER, Howard, M. ディジタルメディア品質をユーザに示す方法、システム及び方法
ES2643789T3 (es) * 2013-05-24 2017-11-24 Dolby International Ab Codificación eficiente de escenas de audio que comprenden objetos de audio
TWI557724B (zh) * 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
EP2854133A1 (de) * 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung eines Abwärtsmischsignals
US9794712B2 (en) 2014-04-25 2017-10-17 Dolby Laboratories Licensing Corporation Matrix decomposition for rendering adaptive audio using high definition audio codecs
WO2015164572A1 (en) 2014-04-25 2015-10-29 Dolby Laboratories Licensing Corporation Audio segmentation based on spatial metadata
CN110164483B (zh) * 2014-10-03 2021-03-02 杜比国际公司 渲染音频节目的方法和系统
WO2016168408A1 (en) 2015-04-17 2016-10-20 Dolby Laboratories Licensing Corporation Audio encoding and rendering with discontinuity compensation
TWI596955B (zh) * 2015-07-09 2017-08-21 元鼎音訊股份有限公司 具有測試功能之助聽器
WO2017019674A1 (en) 2015-07-28 2017-02-02 Dolby Laboratories Licensing Corporation Audio discontinuity detection and correction
GB2547877B (en) * 2015-12-21 2019-08-14 Graham Craven Peter Lossless bandsplitting and bandjoining using allpass filters
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
CA3127805C (en) 2016-11-08 2023-12-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
US10522155B2 (en) 2017-02-21 2019-12-31 Cirrus Logic, Inc. Pulse code modulation (PCM) data-marking
TWI739297B (zh) * 2020-02-06 2021-09-11 瑞昱半導體股份有限公司 音訊處理裝置及音訊處理方法
WO2023191796A1 (en) * 2022-03-31 2023-10-05 Zeku, Inc. Apparatus and method for data compression and data upsampling
GB2624686A (en) * 2022-11-25 2024-05-29 Lenbrook Industries Ltd Improvements to audio coding

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4113506A1 (de) * 1991-04-25 1992-10-29 Thomson Brandt Gmbh Verfahren zur kompatiblen uebertragung von progressiv abgetasteten bildsignalen im zwischenzeilen-format
US5396228A (en) * 1992-01-16 1995-03-07 Mobile Telecommunications Technologies Methods and apparatus for compressing and decompressing paging data
EP0631458B1 (de) * 1993-06-22 2001-11-07 Deutsche Thomson-Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
US5623424A (en) * 1995-05-08 1997-04-22 Kabushiki Kaisha Toshiba Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels
US5684714A (en) * 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
GB9509831D0 (en) * 1995-05-15 1995-07-05 Gerzon Michael A Lossless coding method for waveform data
EP0784409A3 (de) * 1996-01-11 2001-11-14 Sony Corporation Videokodierung und -multiplex
US5731837A (en) * 1996-01-25 1998-03-24 Thomson Multimedia, S.A. Quantization circuitry as for video signal compression systems
US5715187A (en) 1996-03-04 1998-02-03 Holtek Microelectronics, Inc. Method and apparatus for integer multiplication
US5839100A (en) * 1996-04-22 1998-11-17 Wegener; Albert William Lossless and loss-limited compression of sampled data signals
US5832490A (en) * 1996-05-31 1998-11-03 Siemens Medical Systems, Inc. Lossless data compression technique that also facilitates signal analysis
US5848106A (en) * 1996-12-16 1998-12-08 Ericsson, Inc. Receiver decoder circuitry, and associated method, for decoding an encoded signal
GB2323754B (en) * 1997-01-30 2002-03-20 Peter Graham Craven Lossless compression using iir prediction filters
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
US6023233A (en) 1998-03-20 2000-02-08 Craven; Peter G. Data rate control for variable rate compression systems

Also Published As

Publication number Publication date
EP2339756A2 (de) 2011-06-29
WO2000060746A3 (en) 2001-03-08
EP1173925B1 (de) 2003-12-03
KR20010113782A (ko) 2001-12-28
CA2742649C (en) 2014-11-04
US6774820B2 (en) 2004-08-10
US20050007262A1 (en) 2005-01-13
TWI226041B (en) 2005-01-01
CA2365529A1 (en) 2000-10-12
AU3828400A (en) 2000-10-23
MY149792A (en) 2013-10-14
CA2742649A1 (en) 2000-10-12
DK1173925T3 (da) 2004-03-29
EP2391146A3 (de) 2011-12-14
US20040070523A1 (en) 2004-04-15
EP1370114A2 (de) 2003-12-10
US6611212B1 (en) 2003-08-26
EP2339756A3 (de) 2011-12-21
AU781629B2 (en) 2005-06-02
SG2012056305A (en) 2015-09-29
ES2208297T3 (es) 2004-06-16
ATE255785T1 (de) 2003-12-15
AR023424A1 (es) 2002-09-04
CA2859333A1 (en) 2000-10-12
KR100915120B1 (ko) 2009-09-03
JP4610087B2 (ja) 2011-01-12
SG144695A1 (en) 2008-08-28
CA2365529C (en) 2011-08-30
EP1370114A3 (de) 2004-03-17
MY123651A (en) 2006-05-31
EP1173925A2 (de) 2002-01-23
EP2391146A2 (de) 2011-11-30
US7193538B2 (en) 2007-03-20
DE60006953D1 (de) 2004-01-15
WO2000060746A2 (en) 2000-10-12
JP2002541524A (ja) 2002-12-03

Similar Documents

Publication Publication Date Title
DE60006953T2 (de) Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
DE69629369T2 (de) Verfahren zum kodieren wellenförmiger daten
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE602006000239T2 (de) Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter
DE69934454T2 (de) Digitalaudiosignaldekodierungsvorrichtung und -verfahren und Aufzeichnungsträger zum Speichern der Dekodierungsstufen
DE602004001868T2 (de) Verfahren zum bearbeiten komprimierter audiodaten zur räumlichen wiedergabe
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
DE69531471T2 (de) Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung
DE602005006424T2 (de) Stereokompatible mehrkanal-audiokodierung
DE602005002256T2 (de) Auf mehrfachparametrisierung basierende mehrkanalrekonstruktion
EP1864279B1 (de) Vorrichtung und verfahren zum erzeugen eines datenstroms und zum erzeugen einer multikanal-darstellung
DE602005002942T2 (de) Verfahren zur darstellung von mehrkanal-audiosignalen
DE69734645T2 (de) Datenverarbeitung von einem bitstromsignal
DE69829242T2 (de) Tonsignalkodierverfahren und -gerät
DE602004000884T2 (de) Digitales Audiowasserzeichen
WO2005083702A1 (de) Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd
DE60025219T2 (de) System zur aufzeichnung und wiedergabe von tonsignalen
DE202004003000U1 (de) Vorrichtung zum Beschreiben einer Audio-CD und Audio-CD

Legal Events

Date Code Title Description
8364 No opposition during term of opposition