-
HINTERGRUND DER ERFINDUNG
-
Gebiet der Erfindung
-
Diese
Erfindung betrifft ein Decodierungsverfahren und -gerät zur Decodierung
von Mehrkanal-Akustiksignalen.
-
Beschreibung der verwandten Technik
-
Es
ist bislang ein Aufzeichnungsmedium, das zur Aufzeichnung von Signalen
wie beispielsweise der codierten Akustikinformation oder der Musikinformation
(nachfolgend als Audiosignale bezeichnet) wie beispielsweise eine
magnetooptische Platte fähig ist,
vorgeschlagen worden. Unter Verfahren zur hocheffizienten Codierung
der Audiosignale gibt es eine sogenannte Transformationscodierung,
die ein verblockendes Frequenzspektrumsteilungsverfahren (blocking
frequency spectrum splitting method) zum Transformieren eines Zeitbereichssignals
in Frequenzbereichssignale durch eine orthogonale Transformation
und Codieren der spektralen Komponenten von einem Frequenzband zu
einem anderen ist, und ein SBC-Verfahren
(SBC = sub-band encoding (Subbandcodierung)), das ein nichtverblockendes
Frequenzspektrumsteilungsverfahren zum Aufspalten bzw. Teilen der
Zeitbereichsaudiosignale in mehrere Frequenzbänder ohne Verblocken und Codieren
der resultierenden Signale der Frequenzbänder ist. Es ist auch eine
hocheffiziente Codierungstechnik bekannt, die eine Kombination aus
der Subbandcodierung und Transformationscodierung ist, in welchem
Fall die Zeitbereichssignale durch SBC in mehrere Frequenzbänder geteilt
werden und die resultierenden Bandsignale in spektrale Komponenten
orthogonal transformiert werden, die von Band zu Band codiert werden.
-
Unter
den oben erwähnten
Filtern ist ein sogenanntes QMF-Filter (QMF = Quadrature Mirror
Filter (Quadraturspiegelfilter)), wie es in 1976, R.E. Crochiere,
Digital Coding of Speech in subbands, Bell Syst. Tech. J. Vol. 55,
Nr. 8, 1976 beschrieben ist. Dieses QMF-Filter teilt das Frequenzspektrum
in zwei Bänder
gleicher Bandbreite und ist dadurch gekennzeichnet, dass bei einer
nachfolgenden Synthetisierung der geteilten Bänder kein sogenanntes Aliasing
(Signalverfälschung, Überfaltungsfehler)
erzeugt wird. Die Technik des Teilens des Frequenzspektrums ist
in Joseph H. Rothweiler, Polyphase Quadrature Filters – A New
Subband Coding Technique, ICASSP 83 BOSTON, beschrieben. Dieses Mehrphasen-Quadraturfilter
ist dadurch gekennzeichnet, dass das Signal zu einer Zeit in mehrere Bänder gleicher
Bandbreite geteilt werden kann.
-
Unter
den oben erwähnten
Techniken zur orthogonalen Transformation ist eine Technik derart, dass
ein Eingangsaudiosignal bei jeder voreingestellten Einheitszeit
beispielsweise jedem Rahmen verblockt wird und auf jeden Block eine
diskrete Fourier-Transformation (DFT), diskrete Cosinustransformation
(DCT) oder modifizierte DCT (MDCT) zur Umsetzung der Signale von
der Zeitachse in die Frequenzachse angewendet wird. Beschreibungen
der MDCT sind in J.P. Princen and A.B. Bradley, Subband/Transform
coding Using Filter Bank Based an Time Domgin Aliasing Cancellation,
ICASP 1987 zu finden.
-
Wenn
die oben erwähnte
DFT oder DCT als ein Verfahren zum Transformieren von Wellenformsignalen
in spektrale Signale benutzt wird und die Transformation auf Basis
eines aus M Samples (Abtastungen) zusammengesetzten Zeitblocks angewendet
wird, werden M unabhängige
Reellzahldaten erhalten. Es sei darauf hingewiesen, dass zur Reduzierung
von Verbindungsstörungen
zwischen Zeitblöcken
ein gegebener Zeitblock üblicherweise
mit M1 Samples mit beiden benachbarten Blöcken überlappt wird und bei einer
DFT oder DCT im Durchschnitt M Reellzeitdaten für (M-M1) Samples quantisiert
und codiert werden. Es sind diese M Reellzahldaten, die nachfolgend
quantisiert und codiert werden.
-
Wenn
andererseits die oben erwähnte MDCT
als ein Verfahren zur orthogonalen Transformation benutzt wird,
werden M unabhängige
Reellzahldaten aus 2 M Samples, die mit M Samples beider benachbarten
Zeitblöcke überlappt
sind, erhalten. Infolgedessen werden bei einer MDCT M im Durchschnitt
Reellzahldaten für
M Samples erhalten und nachfolgend quantisiert und codiert. Eine
Decodierungseinrichtung addiert Wellenformelemente, die bei einer
inversen Transformation in jedem Block aus den durch die MDCT mit
einer Interferenz erhalten Codes zum Rekonstruieren der Wellenformsignale erhalten
werden.
-
Wenn
ein Zeitblock für
eine Transformation verlängert
wird, wird generell die Spektrumsfrequenzauflösung derart verbessert, dass
die Signalenergie in spezifizierten Frequenzkomponenten konzentriert ist.
Deshalb kann durch Benutzung einer MDCT, bei der durch Überlappung
mit einer Hälfte
jedes von beiden benachbarten Blöcken
eine Transformation mit langen Blocklängen ausgeführt wird und bei der die Anzahl
der resultierenden Spektralsignale nicht über die Anzahl der originalen
Zeitsamples hinaus erhöht wird,
eine Codierung mit einer höheren
Effizienz ausgeführt
werden, als wenn die DFT oder DCT benutzt wird. Da überdies
die benachbarten Blöcke
ausreichend lang miteinander überlappt
sind, kann die Interblockverzerrung der Wellenformsignale reduziert werden.
Wenn jedoch für
eine Transformation die Transformationsblocklänge verlängert wird, ist zur Transformation
mehr Arbeitsbereich erforderlich, wodurch bei der Größe einer
Wiedergabeeinrichtung eine Reduktion verhindert wird. Insbesondere
sollte die Benutzung eines langen Transformationsblocks zu einem
Zeitpunkt, bei dem es schwierig ist, den Integrationsgrad eines
Halbleiters zu erhöhen,
vermieden werden, da dies die Herstellungskosten erhöht.
-
Durch
eine Quantisierung von Signalen, die durch ein Filter oder eine
orthogonale Transformation in mehrere Frequenzbänder geteilt sind, kann das Frequenzband,
in welchem das Quantisierungsrauschen auftritt, kontrolliert werden,
so dass eine Codierung mit psychoakustisch höherer Effizienz durch Ausnutzung
von Akustikcharakteristiken wie beispielsweise Maskierungseffekten
erreicht werden. Wenn in den jeweiligen Bändern die Signalkomponenten
mit den Maximumwerten der absoluten Werte der Signalkomponenten
normiert werden, kann eine Codierung mit einer noch höheren Effizienz
erreicht werden.
-
Im
Fall einer Quantisierung der bei einer Aufspaltung bzw. Teilung
des Frequenzspektrums erhalten Frequenzkomponenten ist es bezüglich Frequenzbandbreiten
bekannt, das Frequenzspektrum derart zu teilen, dass die Psychoakustikcharakteristiken
des menschlichen Gehörsystems
berücksichtigt werden.
Insbesondere werden die Audiosignale in mehrere, beispielsweise
25 Bänder
geteilt, wobei Bandbreiten benutzt werden, die mit zunehmender Frequenz
zunehmen. Diese Bänder
sind als kritische Bänder
bekannt. Bei einer Codierung der Band-basierten Daten wird die Codierung
durch eine feste oder adaptive Bitzuteilung auf der Bandbasis ausgeführt. Bei
einer Codierung von durch eine oben beschriebene MDCT-Verarbeitung durch
Bitzuteilung erhaltenen Koeffizientendaten ist die Codierung durch
eine adaptive Anzahl einer Bitzuteilung für durch eine Block-basierte
MDCT-Verarbeitung
erhaltene Band-basierte MDCT-Koeffizienten. Bezüglich dieser Bitzuteilungstechniken
sind die zwei folgenden Techniken bekannt.
-
Beispielsweise
wird bei R. Zelinsky and P. Noll, „Adaptive Transform Coding
of Speech Signals" und
in „IEEE
Transactions of Acoustics, Speech and Signal Pricessing, Vol. ASSP-25,
Nr. 4, August 1977 eine Bitzuteilung auf der Basis der Größe der Band-basierten
Signale ausgeführt.
Bei diesem System wird das Quantisierungsrauschenspektrum derart
flach, dass das Quantisierungsrauschen minimiert ist. Jedoch ist
das tatsächliche
Rauschengefühl
psychoakustisch nicht optimal, da der psychoakustische Maskierungseffekt
nicht ausgenutzt ist.
-
Bei
der Veröffentlichung „ICASSP
1980, „The critical
band coder – digital
encoding of the perceptual requirements of the auditory system,
M.A. Krasner, MIT",
ist der psychoakustische Maskierungsmechanismus zum Bestimmen einer
festen Bitzuteilung benutzt, die für jedes kritische Band das
notwendige Signal-zu-Rauschen-Verhältnis erzeugt.
Wenn jedoch diese Technik zur Messung von Charakteristiken einer
Sinuswelleneingabe benutzt wird, werden wegen der festen Zuteilung
von Bits nicht-optimale Resultate zwischen den kritischen Bändern erhalten.
-
Zur Überwindung
dieser Probleme ist eine hocheffiziente Codierungseinrichtung vorgeschlagen,
bei der ein Abschnitt der Gesamtzahl von für eine Bitzuteilung benutzbaren
Bits für
ein von einem kleinen Block zu einem anderen vorher fest eingestelltes
Festbitzuteilungsmuster benutzt wird und der verbleibende Abschnitt
für eine
von den Signalamplituden der jeweiligen Blöcke abhängige Bitzuteilung benutzt
wird und bei der das Bitanzahl-Teilungsverhältnis zwischen der festen Bitzuteilung
und der von den Signalamplituden abhängigen Bitzuteilung von einem
sich auf ein Eingangssignal beziehenden Signal derart abhängig gemacht
ist, dass das Bitanzahl-Teilungsverhältnis zur festen Bitzuteilung
um so größer wird,
je glatter das Signalspektrum ist.
-
Diese
Technik verbessert durch Zuteilen von mehr Bits einem Block, der
ein eine konzentrierte Signalenergie zeigendes besonderes Signalspektrum wie
im Fall eines Sinuswelleneingangssignals, bei der Signalenergien
in spezifizierten Spektralsignalkomponenten konzentriert sind, aufweist,
das Signal-zu-Rauschen-Verhältnis im
Ganzen signifikant. Durch Benutzung der obigen Techniken werden
zur Verbesserung der Signal-zu-Rauschen-Verhältnis-Charakteristiken nicht
nur die gemessenen Werte erhöht,
sondern auch der vom Hörer
wahrgenommene Ton wird in der Signalqualität verbessert, weil das menschliche
Gehörsystem
für Signale
empfindlich ist, die spitze bzw. scharfe Spektralkomponenten aufweisen.
-
Es
sind eine Anzahl unterschiedlicher Bitzuteilungstechniken vorgeschlagen
worden und es ist auch ein den menschlichen Gehörmechanismus simulierendes
Modell vollkommener geworden, so dass eine wahrnehmbar höhere Codierungseffizienz erreicht
werden kann, wobei angenommen ist, dass die Codierungseinrichtungsfähigkeit
entsprechend verbessert ist.
-
Bei
diesen Techniken ist es übliche
Praxis, für
eine Bitzuteilung Reellzahlreferenzwerte zu finden, welche die durch
Berechnungen gefundenen Signal-zu-Rauschen-Charakteristiken
so treu wie möglich
realisieren, und ganzzahlige Werte zu benutzen, welche die als Bitanzahlen
zugeteilten Referenzwerte approximieren.
-
Zum
Konstuieren einer realen Codekette reicht es aus, wenn von einem
Normierungs/Quantisierungs-Band zu einem anderen die Quantisierungsfeinheitsinformation
und die Normierungskoeffizienteninformation mit voreingestellten
Anzahlen von Bits codiert werden und die normierten und quantisierten
Spektralsignalkomponenten codiert werden. Beim ISO-Standard (ISO/IFC
111772-3:1993 (E), 1993) ist ein Hocheffizienzcodierungssystem beschrieben,
bei dem die die Quantisierungsfeinheitsinformation darstellenden
Anzahlen von Bits so eingestellt werden, dass sie von einem Band
zu einem anderen unterschiedliche sind. Insbesondere wird die die
Quantisierungsfeinheitsinformation darstellende Anzahl von Bits
so eingestellt, dass sie mit der zunehmenden Frequenz abnimmt.
-
Es
ist auch ein Verfahren zur Bestimmung der Quantisierungsfeinheitsinformation
in der Decodierungseinrichtung aus beispielsweise der Normierungskoeffizienteninformation
bekannt. Da die Relation zwischen der Normierungskoeffizienteninformation
und der Quantisierungsfeinheitsinformation zur Zeit der Einstellung
des Standards eingestellt wird, wird es unmöglich, die Quantisierungsfeinheitssteuerung
auf Basis eines in Zukunft fortschrittlicheren psychoakustischen
Modells einzubringen. Wenn es außerdem eine Breite im zu realisierenden
Kompressionsverhältnis
gibt, wird es notwendig, die Relation zwischen der Normierungskoeffizienteninformation und
der Quantisierungsfeinheitsinformation von einem Kompressionsverhältnis zu
einem andern einzustellen.
-
Es
ist auch ein Verfahren einer Benutzung von Variabellängencodes
zur Codierung zur Realisierung einer effizienteren Codierung von
quantisierten Spektralsignalkomponenten wie es in D.A. Huffman, „A Method
for Construction of Minimum Redundancy Codes", in Proc. I.R.E., 40, Seite 1098 (1952)
beschrieben ist bekannt.
-
In
der internationalen Offenlegung
WO94/28633 des
hier genannten Rechtsinhabers geht ein Verfahren zum wahrnehmbaren
Separieren kritischer tonaler Komponenten, die Signalkomponenten
sind, bei denen die Signalenergie in der Nähe einer spezifizierten Frequenz
konzentriert ist, von den spektralen Signalen und separaten Codieren
der Signalkomponenten von den verbleibenden Spektralkomponenten
hervor. Dies ermöglicht,
dass Audiosignale mit einem hohen Kompressionsverhältnis ohne wesentliche
Verschlechterung der psychoakustischen Tonqualität effizient codiert werden.
-
Die
oben beschriebenen Codierungstechniken können auf jeweilige Kanäle von durch
mehrere Kanäle
konstruierten akustischen Signalen angewendet werden. Beispielsweise
können
die Codierungstechniken auf jeden vom linken Kanal, der einem Linksseite-Lautsprecher
zugeordnet ist, und rechten Kanal, der einem Rechtseite-Lautsprecher zugeordnet
ist, angewendet werden. Der L- und R-Kanal der Audiosignale sind
als derart miteinander korreliert bekannt, dass diese Korrelation
zum Realisieren einer Codierung mit einer höheren Effizienz benutzt werden
kann. Beispielsweise ist in der Veröffentlichung „Perceptual
Transform Coding of Wideband Stereo Signals", James D. Johnston, ICSSSP89, picture
processing 1993 to 1995) eine Technik zum Bilden einer Summe und
einer Differenz des eingegebenen L- und R-Kanals, Umsetzen dieser in spektrale
Signale, Finden einer Maskierungskurve aus dem Spektrum der Summe
und Quantisieren des Spektrums der Summe und des der Differenz unter
Benutzung der Maskierungskurve zum Erzielen einer Codierung beschrieben.
Da es generell häufig auftritt,
dass die L-Kanal-Signale ähnlich
zu den R-Kanal-Signalen
sind, ist der Signalpegel des mit (L-R) korrespondierenden Kanals
sehr niedrig, so dass er mit einer relativ kleinen Anzahl von Bits
codiert werden kann. Es ist ein zusätzliches Verdienst dieser Technik,
dass monoaurale Signale durch Wiedergabe nur der Signale des mit
(L+R) korrespondierenden Kanals wiedergegeben werden können
-
Beim
ISO-Standard (ISO/IEC 11172-3:1993(E), 1993) ist ein System beschrieben, bei
dem ein L- und R-Kanal durch ein Filter geteilt werden, beide L-
und R-Kanal-Signale oder mit (L+R) und (L-R) korrespondierende Kanalsignale
für die Bänder der
niedrigeren Frequenz codiert werden und bei dem nur Normierungskoeffizienten
jedes Bands mit der höheren
Frequenz für
beide Kanäle
separat codiert werden.
-
Bei
dem Verfahren zur Codierung des mit (L+R) korrespondierenden Kanals
und des mit (L-R) korrespondierenden Kanals im ganzen Spektrum müssen Signale
der zwei Kanäle
codiert werden, selbst wenn einer der Kanäle von einem niedrigen Signalpegel
ist. Dies setzt eine Grenze zur Verbesserung der Kompressionseffizienz
durch Codierung. Wenn nur die Normierungskoeffizienten für die Hochbereichsseite
codiert werden, ist bei der Codierung der Normierungskoeffizienten
für das
ganze Frequenzspektrum eine signifikante Anzahl von Bits erforderlich.
-
Überdies
sind bei der obigen Technik zur Codierung und Decodierung von Signalen
des ganzen Spektrums jedes von zwei Kanälen eine Transformations- und
inverse Transformationsoperation erforderlich, wodurch das Volumen
des zu einer vorübergehenden
Speicherung benutzten Pufferspeichers erhöht wird.
-
Sowohl
WO 95/30286 als auch
US-5 539 829 beschreiben
Codierungstechniken, die korrespondierende Komponenten mehrerer
Kanäle
kombinieren, so dass nur ein zusammengesetztes Signal pro Subband übertragen
wird.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
Es
ist eine Aufgabe der vorliegenden Erfindung, ein wie in den beigefügten Ansprüchen definiertes
Decodierungsverfahren und -gerät
bereitzustellen.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
1 ist
ein Blockschaltbild, das einen illustrativen Aufbau eines Aufzeichnungs-/Wiedergabegeräts zeigt;
-
2 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer Codierungsschaltung
zeigt;
-
3 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer Signalkomponentencodierungsschaltung
zeigt;
-
4 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer Transformationsschaltung zeigt;
-
5 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer Decodierungsschaltung
zeigt;
-
6 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer Inverstransformationsschaltung zeigt;
-
7 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer Signalkomponentencodierungsschaltung
zeigt;
-
8 stellt
ein grundlegendes Codierungsverfahren dar;
-
9 stellt
den Aufbau einer durch das grundlegende Codierungsverfahren codierten
Codekette eines Rahmens dar;
-
10 zeigt
ein Beispiel einer Anordnung von L- und R-Kanälen von Rahmen zu Rahmen;
-
11 zeigt
ein Beispiel einer Anordnung des Kanals (L+R)/2 an einem Rahmen;
-
12 stellt
ein Codierungsverfahren dar, bei dem die Signalkomponenten in tonale
Komponenten und Geräusch-
bzw. Rauschenkomponenten geteilt werden und die resultierende Signale
codiert werden;
-
13 stellt
den Aufbau einer Codekette dar, die durch das Codierungsverfahren
zur Teilung der Signalkomponenten in tonale Komponenten und Rauschenkomponenten
und Codierung der resultierenden Signale codiert ist;
-
14 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer Signalkomponentencodierungsschaltung
zeigt, die zur Teilung der Signalkomponenten in tonale Komponenten
und Rauschenkomponenten und Codierung der resultierenden Signale
konfiguriert ist;
-
15 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer Signalkomponentendecodierungsschaltung
zeigt, die zur Decodierung einer beim Teilen der Signalkomponenten
in tonale Komponenten und Rauschenkomponenten und Codierung der resultierenden
Signale erhalten wird;
-
16 ist
ein Blockschaltbild, das einen schematischen Aufbau einer Codierungsschaltung zeigt,
die zur Codierung eines Kanals (L+R)/2 und eines Kanals (L-R)/2
konfiguriert ist;
-
17 ist
ein Blockschaltbild, das einen schematischen Aufbau einer Decodierungsschaltung zur
Decodierung einer bei einer Codierung des Kanals (L+R)/2 und des
Kanals (L-R)/2 erhaltenen Codekette zeigt;
-
18 ist
ein Blockschaltbild, das den schematischen Aufbau einer Codierungsschaltung
zeigt, die zur Codierung des L- und R-Kanals auf der Niedrigbereichsseite
und zur Codierung des (L+R)/2-Kanals auf der Hochbereichsseite konfiguriert
ist;
-
19 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer A-Typ-Signalkomponentencodierungsschaltung
von 18 zeigt;
-
20 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer B-Typ-Signalkomponentencodierungsschaltung
von 18 zeigt;
-
21 stellt
den Aufbau einer Codekette dar, die bei einer Codierung des L- und R-Kanals auf der
Niedrigfrequenzseite und bei einer Codierung des (L+R)/2-Kanals auf der Hochfrequenzseite
erhalten wird;
-
22 ist
ein Blockschaltbild, das den schematischen Aufbau einer Codierungsschaltung
zeigt, die zur Codierung des L- und R-Kanals auf der Niedrigfrequenzseite
und zur Codierung des (L+R)/2-Kanals auf der Hochfrequenzseite konfiguriert
ist;
-
23 ist
ein Blockschaltbild, das den schematischen Aufbau einer Codierungsschaltung
zeigt, die zur Codierung des L- und R-Kanals auf der Niedrigfrequenzseite
und zur Codierung gemeinsamer Signale für den L- und R-Kanal auf der
Hochfrequenzseite konfiguriert ist;
-
24 ist
ein Blockschaltbild, das einen illustrativen Aufbau einer Signalkomponentencodierungsschaltung
der Codierungsschaltung von 23 zeigt;
-
25 ist
ein Flussdiagramm zur Darstellung eines Verarbeitungsbeispiels der
Steuerungsschaltung der Codierungsschaltung von 23;
-
26 stellt
den Aufbau einer Codekette dar, die bei einer Codierung des L- und R-Kanals auf der
Niedrigfrequenzseite und bei einer Codierung gemeinsamer Signale
für den
L- und R-Kanal auf der Hochfrequenzseite erhalten wird;
-
27 ist
ein Blockschaltbild, das den Aufbau einer Decodierungsschaltung
zeigt, die zur Decodierung einer bei einer Codierung des L- und
R-Kanals auf der Niedrigfrequenzseite und bei einer Codierung gemeinsamer
Signale für
den L- und R-Kanal auf
der Hochfrequenzseite erhaltenen Codekette konfiguriert ist;
-
28 ist
ein Blockschaltbild, das den schematischen Aufbau einer Codierungsschaltung
zeigt, die zur Codierung des L- und R-Kanals auf der Niedrigfrequenzseite
und zur Codierung gemeinsamer Signale für den L- und R-Kanal auf der
Hochfrequenzseite konfiguriert ist;
-
29 ist
ein Blockschaltbild, das den Aufbau einer Codierungsschaltung zeigt,
die zur Decodierung einer bei einer Codierung des L- und R-Kanals
auf der Niedrigfrequenzseite und bei einer Codierung gemeinsamer
Signale für
den L- und R-Kanal auf
der Hochfrequenzseite erhaltenen Codekette konfiguriert ist;
-
30 ist
ein Blockschaltbild, das einen schematischen Aufbau einer Decodierungsschaltung gemäß einer
modifizierten Ausführungsform
zeigt, die zur Decodierung einer Codekette konfiguriert ist, die
bei einer Codierung derart, dass der L- und R-Kanal auf der Hochfrequenzseite
von jedem anderen Signalpegel differiert, erhalten wird;
-
31 ist
ein Flussdiagramm, das den Verarbeitungsfluss des Verfahrens zeigt,
bei dem eine Gewichtungsentscheidungsschaltung der Decodierungsschaltung
von 30 die Gewichtungsparameter bestimmt;
-
32 ist
ein Blockschaltbild, das den schematischen Aufbau einer Codierungsschaltung
zeigt, bei der die Kanäle
(L++R)/2 und (L-R)/2 auf der Niedrigbereichsseite codiert werden
und die gemeinsamen Signale des L- und R-Kanals und die Gewichtungsparameter
auf der Hochbereichsseite codiert werden;
-
33 ist
ein Flussdiagramm, das den Verarbeitungsfluss des Verfahrens zeigt,
bei dem eine Gewichtungsentscheidungsschaltung der Codierungsschaltung
von 32 die Gewichtungsparameter bestimmt;
-
34 stellt
den Aufbau einer Codekette im Fall dar, dass die Kanäle (L+R)/2
und (L-R)/2 auf der Niedrigbereichsseite codiert werden und die
gemeinsamen Signale des L- und R-Kanals und die Gewichtungsparameter
auf der Hochbereichsseite codiert werden;
-
35 ist
ein Blockschaltbild, das den schematischen Aufbau einer Decodierungsschaltung zeigt,
bei der die Kanäle
(L+R)/2 und (L-R)/2 auf der Niedrigbereichsseite codiert werden
und die gemeinsamen Signale des L- und R-Kanals und die Gewichtungsparameter
auf der Hochbereichsseite codiert werden;
-
36 ist
ein Flussdiagramm, das den Verarbeitungsfluss einer Gewichtungskoeffizientenberechnungsschaltung
einer Decodierungsschaltung von 35 darstellt;
-
37 ist
ein Blockschaltbild zur Darstellung des schematischen Aufbaus einer
Codierungsschaltung, die vier aufgespaltene bzw. geteilte Bänder aufweist;
-
38 ist
ein Blockschaltbild zur Darstellung des schematischen Aufbaus einer
Codierungsschaltung, die vier geteilte Bänder aufweist.
-
BESCHREIBUNG BEVORZUGTER AUSFÜHRUNGSFORMEN
-
Anhand
der Zeichnungen werden bevorzugte Ausführungsformen der vorliegenden
Erfindung detailliert erläutert.
-
1 zeigt
den schematischen Aufbau eines Komprimiertdaten-Aufzeichnungs/Wiedergabe-Geräts.
-
Bei
dem in 1 gezeigten Komprimiertdaten-Aufzeichnungs/Wiedergabe-Gerät ist eine
von einem Spindelmotor (M) 51 gedrehte magnetooptische Platte
als ein Aufzeichnungsmedium benutzt. Während einer Datenaufzeichnung
auf der magnetooptischen Platte 1 wird von einem Magnetkopf
(H) 54 ein mit den Aufzeichnungsdaten korrespondierendes modulierendes
magnetisches Feld angelegt, wenn der Laserlichtstrahl durch beispielsweise
einen Magnetkopf 53 durch Ausführung einer sogenannten Magnetfeldmodulationsaufzeichnung
zur Aufzeichnung von Daten entlang einer Aufzeichnungsspur zur magnetooptischen
Platte 1 gestrahlt wird. Während einer Wiedergabe wird
die Aufzeichnungsspur der magnetooptischen Platte 1 vom
Laserlicht durch einen optischen Kopf 53 zu einer photomagnetischen
Datenwiedergabe verfolgt.
-
Der
optische Kopf 53 ist aus einer Laserlichtquelle wie beispielsweise
einer Laserdiode, optischen Komponenten wie beispielsweise einer
Kollimatorlinse, einer Objektivlinse, einen Polarisationsstrahlteiler
und einer Zylinderlinse gebildet. Dieser optische Kopf 53 ist über die
magnetooptische Platte 1 dem Magnetkopf 54 zugekehrt
befestigt. Bei einer Aufzeichnung von Daten auf der magnetooptischen Platte 1 wird
der Magnetkopf 54 durch eine Magnetkopfantriebsschaltung 66 eines
später
erläuterten Aufzeichnungssystems
zum Anlegen des mit den Aufzeichnungsdaten korrespondierenden modulierenden
Magnetfelds zur gleichen Zeit, zu welcher der Laserlichtstrahl durch
den optischen Kopf 53 mittels Ausführung einer thermomagnetischen
Aufzeichnung entsprechend dem Magnetfeldmodulierungssystem gestrahlt
wird, betrieben. Andererseits detektiert der optische Kopf 53 das
reflektierte Licht des auf die Zielspur gestrahlten Laserlichts,
um den Fokussierungsfehler durch das astigmatische Verfahren zu
detektieren und um den Fokussierungsfehler durch das Gegentaktverfahren
zu detektieren. Zur Wiedergabe von Daten von der magnetooptischen Platte 1 detektiert
der optische Kopf 52 die Fokussierungsfehler und die Nachführungsfehler
zu der gleichen Zeit, zu der er die Differenz im Polarisationswinkel
(Kerr-Rotationswinkel) von der Zielspur des Laserlichts zum Erzeugen
von Wiedergabesignalen detektiert.
-
Ein
Ausgangssignal des optischen Kopfs 53 wird einer RF-Schaltung 55 zugeführt, weiche
die Fokussierungsfehlersignale und die Nachführungsfehlersignale vom Ausgangssignal
des optischen Kopfs 53 extrahiert, um die extrahierten
Signale einer Servosteuerungsschaltung 56 zuzuführen, während die Wiedergabesignale
in ein Bipegelsignal umgesetzt werden, das einem Decodierer 71 des
Wiedergabesystems zugeführt
wird.
-
Die
Servosteuerungsschaltung 56 ist aus beispielsweise einer
Fokussierungsservosteuerungsschaltung, einer Nachführungsservosteuerungsschaltung,
einer Spindelmotorservosteuerungsschaltung und einer Gewindeservosteuerungsschaltung
gebildet. Die Fokussierungsservosteuerungsschaltung Fokussierungs-steuert
das optische System des optischen Kopfs 53 zur Reduzierung
der Fokussierungsfehlersignale auf null, während die Nachführungsservosteuerungsschaltung
das optische System des optischen Kopfs 53 zur Reduzierung
der Nachführungsfehlersignale
auf Null Nachführungs-steuert.
Die Spindelmotorservosteuerungsschaltung steuert den Spindelmotor 51 so,
dass der magnetooptische Kopf 1 mit einer voreingestellten Drehgeschwindigkeit
wie beispielsweise mit einer voreingestellten Lineargeschwindigkeit
gedreht wird. Die Gewindeservosteuerungsschaltung bewegt den optischen
Kopf 53 und den Magnetkopf 54 auch zu einer von
einem Systemkontroller 57 bezeichneten Soll- bzw. Zielspurposition
auf der magnetooptischen Platte 1. Die Servosteuerungsschaltung 56,
die diese unterschiedlichen Steuerungsoperationen ausführt, sendet
die Information, welche die durch die Servosteuerungsschaltung 56 gesteuerten
Operationszustände
der unterschiedlichen Komponenten spezifiziert, zum Systemkontroller 57.
-
Mit
dem Systemkontroller 57 sind eine Tasteneingabebetätigungseinheit 58 und
eine Anzeigeeinheit 59 verbunden. Der Systemkontroller 57 überwacht
das Aufzeichnungssystem und das Wiedergabesystem durch die Betätigungseingabeinformation aus
der Tasteneingabeeinheit 58. Der Systemkontroller 57 überwacht
auch die Aufzeichnungsposition oder die Wiedergabeposition auf der
vom optischen Kopf 53 und Magnetkopf 54 verfolgten
Aufzeichnungsspur auf Basis der durch den Headerzeitgeber wiedergegebenen
Sektor-basierten Adresseninformation oder Subcode-Q-Daten von der
Aufzeichnungsspur der magnetooptischen Platte 1. Der Systemkontroller 57 führt auch
eine Steuerung einer Anzeige der Wiedergabezeit auf der Anzeigeeinheit 59 auf
Basis der Datenkompressionsrate der Komprimiertdaten-Aufzeichnungs/Wiedergabe-Einrichtung und der
Wiedergabepositionsinformation auf der Aufzeichnungsspur aus.
-
Für eine Wiedergabezeitanzeige
wird die durch die Headerdaten oder die Subcode-Q-Daten von der
Aufzeichnungsspur der magnetooptischen Platte 1 wiedergegebene
Sektor-basierte Adresseninformation (absolute Zeitinformation) mit
dem Kehrwert des Datenkompressionsverhältnisses wie beispielsweise
4 für die
1/4-Kompression
multipliziert, um die tatsächliche
Zeitinformation zu finden, die auf der Anzeigeeinheit 59 angezeigt
wird. Für
eine Aufzeichnung kann, wenn die absolute Zeitinformation auf der
Aufzeichnungsspur beispielsweise einer magnetooptischen Platte voraufgezeichnet
(vorformatiert) ist, die vorformatierte absolute Zeitinformation ausgelesen
und mit dem Kehrwert des Datenkompressionsverhältnisses zur Anzeige der laufenden
Position in Form der tatsächlichen
Zeitinformation ausgelesen werden.
-
Bei
diesem Aufzeichnungssystem der Platten-Aufzeichnungs/Wiedergabe-Einrichtung wird
ein analoges Audioeingangssignal Ain an
einem Eingangsanschluss 60 über ein Tiefpassfilter (TPF) 61 einem
A/D-Umsetzer 62 zugeführt,
der dann das analoge Audioeingangssignal Ain quantisiert.
Das digitale Audiosignal vom A/D-Umsetzer 62 wird
einem ATC-Codierer 63 zugeführt. Das digitale Audioeingangssignal
Din vom Eingangsanschluss 67 wird über eine
digitale Eingangsschnittstellenschaltung (digitale Eingabe) 68 dem
ATC-Codierer 63 (ATC = Adaptive Transform Coding (adaptive
Transformationscodierung)) zugeführt.
Der ATC-Codierer 63 führt
eine Bitkompression (Datenkompression) aus, die mit einem voreingestellten
Datenkompressionsverhältnis der
digitalen Audio-PCM-Daten der voreingestellten Übertragungsrate korrespondiert,
die bei einer Quantisierung des Eingangssignals Ain durch
den A/D-Umsetzer 62 erhalten wird. Die mit dem voreingestellten Datenkompressionsverhältnis ausgegebenen
komprimierten Daten (ATC-Daten) werden einem Speicher 64 zugeführt. Unter
der Annahme, dass das Datenkompressionsverhältnis 1/8 ist, wird die Datenübertragungsrate
auf ein Achtel der Datenübertragungsrate
des CD-DA-Formats als dem Standard-Digitalaudio-CD-Format von 75 Sektoren/s
oder 9,375 Sektoren/Sekunde reduziert.
-
Der
Speicher (RAM) 64 wird als ein Pufferspeicher benutzt,
der ein vom Systemkontroller 57 gesteuertes Daten-Schreiben/Auslesen
aufweist und der zum vorübergehenden
Halten der vom ATC-Codierer 63 zugeführten ATC-Daten auf dem Speicher zur
Aufzeichnung der Daten auf einer Platte wenn immer die Notwendigkeit
auftritt konfiguriert ist. Das heißt, wenn das Datenkompressionsverhältnis beispielsweise
1/8 ist, weisen die vom ATC-Codierer 63 zugeführten komprimierten
Audiodaten jede auf 1/8 der Datenübertragungsrate für das Standard-CD-DA-Format
von 75 Sektoren/Sekunde, das heißt auf 9,375 Sektoren/Sekunde
reduzierte Datenübertragungsrate
auf. Es sind diese komprimierten Daten (ATC-Daten), die im Speicher 64 kontinuierlich aufgezeichnet
werden. Für
diese komprimierten Daten (ATC-Daten) reicht es wie früher beschrieben aus,
die Daten mit einer Rate von einem Sektor pro acht Sektoren aufzuzeichnen.
Da jedoch diese Aufzeichnung alle acht Sektoren im Grunde genommen unmöglich ist,
wird eine Sektor-kontinuierliche Aufzeichnung ausgeführt, was
nachfolgend erläutert wird.
Diese Aufzeichnung wird in einer Burst-artigen Weise mit der gleichen
Datenübertragungsrate
wie die für
das Standard-CD-DA-Format (75 Sektoren/Sekunde) mit voreingestellten
mehreren Sektoren wie beispielsweise 32 Sektoren plus mehrere Sektoren
als eine Aufzeichnungseinheit ausgeführt.
-
Das
heißt
die ATC-Audiodaten mit der Datenkompressionsrate von 1/8, die mit
einer niedrigen Übertragungsrate
von 9,375 (= 75/8) Sektoren/Sekunde kontinuierlich geschrieben werden,
werden vom Speicher 64 in einer Burst-artigen Weise als
Aufzeichnungsdaten mit der oben erwähnten Übertragungsrate von 75 Sektoren/Sekunde
ausgelesen. Die gesamte Datenübertragungsrate
der auf diese Weise ausgelesenen und aufgezeichneten Daten einschließlich der
Nichtaufzeichnungsperiode ist die oben erwähnte niedrige Rate von 9,375
Sektoren/Sekunde. Jedoch ist die momentane Datenübertragungsrate innerhalb der
Zeit der Burst-artigen Aufzeichnungsoperation die oben erwähnte Standardrate
von 75 Sektoren/Sekunde. Deshalb ist, wenn die Drehgeschwindigkeit
der Platte die oben erwähnte Standardgeschwindigkeit
des CD-DA-Formats (konstante Lineargeschwindigkeit) ist, die Aufzeichnung mit
der gleichen Aufzeichnungsdichte und dem gleichen Aufzeichnungsmuster
wie die des CD-DA-Formats.
-
Die
vom Speicher 64 mit der (momentanen) Übertragungsrate von 75 Sektoren/Sekunde
in der Burst-artigen Weise ausgelesenen ATC-Audiodaten, welche die
Aufzeichnungsdaten sind, werden einem Codierer 65 zugeführt. In
der vom Speicher 64 dem Codierer 65 zugeführten Datenkette
ist eine kontinuierliche Aufzeichnungseinheit pro jeder Aufzeichnung ein
Cluster, der aus mehreren Sektoren wie beispielsweise 32 Sektoren
und mehreren vor und hinter dem Cluster angeordneten Clusterverbindungsektoren gebildet
ist. Diese Clusterverbindungsektoren sind so eingestellt, dass sie
länger
als die Überlappungslänge beim
Codierer 65 sind, so dass eine Überlappung Daten anderer Cluster
nicht beeinflussen kann.
-
Der
Codierer 65 wendet bei den in einer Burst-artigen Weise
vom Speicher 64 zugeführten Aufzeichnungsdaten
eine Codierung zur Fehlerkorrektur wie beispielsweise eine Paritätsanhängung und Überlappung
oder eine EFM-Codierung an. Die vom Codierer 65 codierten
Aufzeichnungsdaten werden der Magnetkopfantriebsschaltung 66 zugeführt. Mit
dieser Magnetkopfantriebsschaltung 66 ist der Magnetkopf 64 verbunden,
so dass der Magnetkopf 64 zum Anlegen des entsprechend
den Aufzeichnungsdaten modulierten Magnetfelds an die magnetooptische
Platte 1 betrieben wird.
-
Der
Systemkontroller 57 führt
beim Speicher 64 eine wie oben beschriebene Speichersteuerung aus,
wobei er auch die Aufzeichnungsposition zur kontinuierlichen Aufzeichnung
der Aufzeichnungsdaten kontinuierlich in einer Burst-artigen Weise
vom Speicher 64 durch diese Speichersteuerung auf der Aufzeichnungsspur
der magnetooptischen Platte 1 steuert. Zur Steuerung der
Aufzeichnungsposition auf diese Weise wird die in einer Burst-artigen
Weise vom Speicher 64 ausgelesene Aufzeichnungsposition
vom Systemkontroller 57 zum Zuführen eines die Aufzeichnungsposition
auf der Aufzeichnungsspur der magnetooptischen Platte 1 bezeichnenden
Steuerungssignals zur Servosteuerungsschaltung 56 überwacht.
-
Das
Wiedergabesystem der in 4 gezeigten Platten-Aufzeichnungs/Wiedergabe-Einrichtung wird
nun erläutert.
Dieses Wiedergabesystem ist zur Wiedergabe von auf der Aufzeichnungsspur
der magnetooptischen Platte 1 von dem oben beschriebenen
Aufzeichnungssystem kontinuierlich aufgezeichneten Aufzeichnungsdaten
konfiguriert. Infolgedessen weist das Wiedergabesystem einen Decodierer 71 auf,
dem ein Bipegelsignal zugeführt
wird, das von einer RF-Schaltung 55 aus dem Wiedergabeausgangssignal
erhalten wird, das wiederum von dem die Aufzeichnungsspur der magnetooptischen
Platte 1 mit einem Laserlichtstrahl verfolgenden optischen Kopf 53 erhalten
wird. Es sei darauf hingewiesen, dass nicht nur die magnetooptische
Platte, sondern auch die optische Nurleseplatte ähnlich zur Kompaktdisk (CD
(compact disc)) gelesen werden kann.
-
Der
Decodierer 71 ist eine Gegenstückeinrichtung zum Codierer 65 des
oben beschriebenen Aufzeichnungssystems. Das durch die RF-Schaltung 55 in
das Bipegelsignal umgesetzte Wiedergabeausgangssignal wird für eine Fehlerkorrektur
decodiert oder wird für
eine Wiedergabe der das Datenkompressionsverhältnis von 1/8 aufweisenden
ATC-Audiodaten mit einer Übertragungsrate
von 75 Sektoren/Sekunde, die schneller als die normale Übertragungsrate
ist, EFM-decodiert. Die vom Decodierer 71 erhaltenen Wiedergabedaten
werden einem Speicher 72 zugeführt.
-
In
den Speicher 72, der ein vom Systemkontroller 57 gesteuertes
Daten-Schreiben/Lesen
aufweist, werden die vom Decodierer 71 mit der Übertragungsrate
von 75 Sektoren/Sekunde zugeführten Wiedergabedaten
in einer Burst-artigen Weise mit der Transferrate von 75 Sektoren/Sekunde
geschrieben. Im Speicher 72 werden die oben erwähnten, mit der
oben erwähnten Übertragungsrate
von 75 Sektoren/Sekunde geschriebenen Wiedergabedaten mit einer
mit der Datenkompressionsrate von 1/8 korrespondierenden Übertragungsrate
von 9,375 Sektoren/Sekunde kontinuierlich ausgelesen.
-
Der
Systemkontroller 57 führt
eine Speichersteuerung zum Schreiben der Wiedergabedaten mit der Übertragungsrate
von 75 Sektoren/Sekunde in den Speicher 72 aus, während die
Wiedergabedaten vom Speicher 7 mit der Übertragungsrate von 9,375 Sektoren/Sekunde
ausgelesen werden. Der Systemkontroller 57, der die Speichersteuerung
für den Speicher 72 wie
oben beschrieben ausführt,
steuert die Wiedergabeposition zum kontinuierlichen Auslesen der
in der Burst-artigen Weise geschriebenen Wiedergabedaten aus dem
Speicher 72 durch die Speichersteuerung von der Aufzeichnungsspur
der magnetooptischen Platte 1. Die Wiedergabepositionssteuerung
wird durch Überwachung
der Wiedergabeposition der durch den Systemkontroller 57 in der
Burst-artigen Weise vom Speicher 72 ausgelesenen Wiedergabedaten
und durch Zuführen
eines die Wiedergabeposition auf der Aufzeichnungsspur der optischen
Platte 1 oder der magnetooptischen Platte 1 bezeichnenden
Steuerungssignals zur Servosteuerungsschaltung 56 ausgeführt.
-
Die
vom Speicher 72 mit der Übertragungsrate von 9,375 Sektoren/Sekunde
kontinuierlich ausgelesenen ATC-Audiodaten werden einem ATC-Decodierer 73 zugeführt. Dieser
ATC-Decodierer 73 ist eine Gegenstückeinrichtung zum ATC-Codierer 63 des
Aufzeichnungssystems und gibt die digitalen 16-Bit-Audiodaten durch
Expandieren der ATC-Daten mit einem Faktor von 8 wieder. Die digitalen
Audiodaten aus dem ATC-Decodierer 73 werden einem D/A-Umsetzer 74 zugeführt.
-
Der
D/A-Umsetzer 74 setzt die vom ATC-Decodierer 73 zugeführten digitalen
Audiodaten in ein analoges Signal zur Bildung eines analogen Audioausgangssignals
Aout (Aaus) um.
Dieses vom D/A-Umsetzer 74 erhaltene analoge Audioausgangssignal Aout wird über
ein Tiefpassfilter 75 an einen Ausgangsanschluss 76 ausgegeben.
-
Es
wird die hocheffiziente Codierung im Detail erläutert. Insbesondere wird die
Technik der hocheffizienten Codierung eines digitalen Eingangssignals
wie beispielsweise eines PCM-Audiosignals durch die Techniken einer
Subbandcodierung (SBC), adaptiven Transformationscodierung (ATC)
und adaptiven Bitzuordnung anhand von 2 ff. erläutert.
-
In
der Codierungseinrichtung (Codierer 63 von 1)
wird zur Ausführung
des Verfahrens zur Codierung der Information (Akustikwellenformsignale)
von einer Umsetzungsschaltung 111a eine Eingangssignalwellenform 110a in
Signalfrequenzkomponenten 110b umgesetzt. Diese Signalfrequenzkomponenten 110b werden
dann von einer Signalkomponentencodierungsschaltung 111b codiert,
um ein codiertes Signal 110c zu erzeugen. Eine Codekettenerzeugungsschaltung 111c erzeugt
dann von einem durch die Codekettenerzeugungsschaltung 111c erzeugten
codierten Signal 110c eine Codekette 110d.
-
Die
Umsetzungsschaltung 111a teilt das Eingangssignal 120a durch
ein Bandteilungsfilter 112a in zwei Bänder, und die resultierenden
zwei Bandsignale 120b, 120c werden durch Vorwärtsorthogonaltransformationsschaltungen 112b, 112c mittels MDCT
in Spektralsignalkomponenten 120d, 120e transformiert.
Das Eingangssignal 120a korrespondiert mit der Signalwellenform 110a von 2,
während
die Spektralsignalkomponenten 120d, 120e mit den
in 2 gezeigten Signalfrequenzkomponenten 110b korrespondieren.
In der in 3 gezeigten Umsetzungsschaltung 112a werden
die Bandbreiten der zwei Band-geteilten Signale 120b, 120c eine
Hälfte der
Bandbreite des Eingangssignals 120a, das heißt das Eingangssignal 120a ist
mit 1/2 ausgedünnt.
Natürlich
kann neben dem illustrativen Beispiel jeder andere Aufbau der Umsetzungsschaltung 111a benutzt werden.
Beispielsweise kann das Eingangssignal durch MDCT direkt in Spektralsignale
transformiert werden, wobei das Eingangssignal anstelle durch MDCT
auch durch DFT oder DCT transformiert werden kann. Obgleich das
Eingangssignal durch ein Bandteilungsfilter in Frequenzkomponenten
geteilt werden kann, wird das Eingangssignal vorzugsweise durch
die oben erwähnten
Orthogonaltransformationsverfahren in Frequenzkomponenten geteilt,
weil dann eine große
Anzahl von Frequenzkomponenten mit einem kleineren Volumen von Verarbeitungsoperationen
erhalten werden kann.
-
Die
Signalkomponentencodierungsschaltung 111b normiert die
Signalkomponenten 130a aus einem voreingestellten Band
zu einem anderen durch eine Normierungsschaltung 113a,
wobei eine Berechnung der Quantisierungsfeinheitsinformation 130c von
den Signalkomponenten 130a durch die wie in 4 gezeigte
Quantisierungsfeinheitsentscheidungsschaltung 113b berechnet
wird. Die Quantisierungsschaltung 113c quantisiert die
normierten Spektralkoeffizientendaten 130b aus der Normierungsschaltung 113a auf
Basis der Quantisierungsfeinheitsinformation 130c. Indessen
korrespondieren die Signalkomponenten 130a mit dem codierten
Signal 110b von 2. Das codierte Signal 110c von 2 weist
die Normierungskoeffizienteninformation 130e zur Normierung
und die oben erwähnten Quantisierungsfeinheitsinformation 130c zusätzlich zu
den quantisierten Signalkomponenten 130d zur Normierung
aus der Quantisierungsschaltung 113c auf.
-
Im
Decodierungsgerät
(Decodierer 73 von 1) zum Regenerieren
des Audiosignals von der durch den oben erwähnten Codierer erzeugten Codekette
werden durch eine wie in 5 gezeigte Codekettenauflösungsschaltung 114a Codes 140b der Signalkomponenten,
Normierungskoeffizienteninformation und die Quantisierungsfeinheitsinformation von
einer Codekette 140a extrahiert. Von diesen Codes 140b werden
durch eine Codekettendecodierungsschaltung 114b Signalkomponenten 140c wiederhergestellt,
und von den wiederhergestellten Signalkomponenten 140c werden
durch eine Rückumsetzungsschaltung 114c Akustikwellenformsignale 140d regeneriert.
-
Diese
Rückumsetzungsschaltung 114c des Informationsdecodierers
ist wie in 6 gezeigt konfiguriert und ist
der in 3 gezeigten Umsetzungsschaltung zugeordnet. In
der in 6 gezeigten Rückumsetzungsschaltung 114c wenden
Inversorthogonaltransformationsschaltungen 115a, 115b auf Eingangssignale 150a, 150b jeweils
eine inverse Orthogonaltransformation zur Wiederherstellung der Bandsignale
an, die dann durch ein Bandsynthetisierungsfilter 115c synthetisiert
werden. Die Eingangssignale 150a, 150b korrespondieren
mit einem Signal 140c, dessen Signalkomponenten durch die
Signalkomponentendecodierungsschaltung 114b wiederhergestellt
worden sind. Ein Ausgangssignal 140e des Bandsynthetisierungsfilters 115c korrespondiert mit
dem Akustikwellenformsignal 140d von 5.
-
Die
Signalkomponentendecodierungsschaltung 114b von 5 ist
wie in 7 gezeigt konfiguriert und wendet bei den Codes 140b aus
der Codekettenauflösungsschaltung 114a,
die Spektralsignale sind, eine Entquantisierungs- und Entnormierungsverarbeitung an.
In der in 7 gezeigten Signalkomponentendecodierungsschaltung 114b entquantisiert
eine Entquantisierungsschaltung 116a Eingangscodes 160a,
während
die Entnormierungsschaltung 116b die bei der Entquantisierung
der Ausgangssignalkomponenten 160c erhaltenen Signale 160b entnormiert.
Die obigen Codes 160a korrespondieren mit Codes 140b aus
der Codekettenauflösungsschaltung 114a von 5,
während
die Ausgangssignalkomponenten 160c mit den Signalkomponenten 140c von 5 korrespondieren.
-
Die
durch die Umsetzungsschaltung des oben beschriebenen, in 3 gezeigten
Codierers erhaltenen Spektralsignale sind wie beispielsweise in 8 gezeigt.
Die in 8 gezeigten Spektralkomponenten bezeichnen Absolutwerte
der Spektralkomponenten durch MDCT nach einer Pegelumsetzung durch
dB-Werte. Das heißt
in diesem Codierer wird das Eingangssignal von einem voreingestellten Transformationsblock
zu einem anderen in 64 Spektralkomponenten umgesetzt und in Form
von hier als Codierungseinheiten bezeichneten acht Bändern normiert
und quantisiert, die in 8 in [1] bis [8] gezeigt sind.
Es sei darauf hingewiesen, dass diese Spektralsignale durch eine
Bandteilung durch das Bandteilungsfilter vorübergehend in zwei Bänder geteilt
werden, gefolgt von einer Vorwärtsorthogonaltransformation,
bei der die Bandbreite der Codierungseinheit unabhängig von
der Bandbreite des Bandteilungsfilters eingestellt werden kann.
Das Eingangssignal kann auch ohne durch das Bandteilungsfilter zu
gehen durch eine Orthogonaltransformation direkt in Spektralsignale
transformiert werden. Wenn die Quantisierungsfeinheit abhängig davon,
wie die Frequenzkomponenten verteilt sind, von einer Codierungseinheit
zu einer anderen variiert wird, ist eine Codierung mit einer wahrnehmbar
hohen Effizienz mit einer Unterdrückung der Tonqualitätsverschlechterung
auf das Minimum sichergestellt.
-
9 zeigt
einen illustrativen Aufbau einer Codekette im Fall einer wie oben
beschriebenen Codierung.
-
Beim
Vorliegen eines illustrativen Aufbaus werden Daten zu einer Wiederherstellung
von Spektralsignalen jedes Transformationsblocks (Zeitblock) entsprechend
Rahmen codiert, deren jeder für
einen ersten Kanal als der linke Kanal und für einen zweiten Kanal als der
rechte Kanal aus einer voreingestellten Anzahl von Bits gebildet
ist, wobei der L- und R-Kanal alternierend angeordnet sind. Ab einem
führenden bzw.
vorderen Ende (Header) jedes Rahmens sind die Information, welche die
Steuerungsdaten wie beispielsweise Synchronisationssignale und die
codierte Anzahl von Codierungseinheiten, die mit einer voreingestellten
Anzahl von Bits codiert sind, ist, die Information, welche die Quantisierungsfeinheitsinformation
und Normierungskoeffizienteninformation jeder Codierungseinheit
ist, und die Spektralkoeffizientendaten, die auf der Basis der Normierungskoeffizientendaten
und der Quantisierungsfeinheitsdaten von einer Codierungseinheit
zu einer anderen normiert und quantisiert sind, sequenziell angeordnet. Die
mit den Steuerungsdaten und den Spektralkoeffizientendaten korrespondierende
Information ist beginnend ab der Niedrigbereichsseitecodierungseinheit
codiert.
-
Die
Anzahl von zur Decodierung der Spektralsignale des Transformationsblocks
tatsächlich
erforderlichen Bits ist durch die Anzahl der codierten Codierungseinheiten
und die Anzahl der durch die Quantisierungsfeinheitsinformation
jeder Codierungseinheit spezifizierten Quantisierungsbits bestimmt.
Die Anzahl von Bits kann von einem Rahmen zu einem anderen variieren.
Die oben erwähnte
erforderliche Anzahl von Bits, gezählt ab dem vorderen Ende jedes
Rahmens, ist während
einer Wiedergabe gültig,
wobei der verbleibende Bereich jedes Rahmens ein Leerbereich ist,
der Wiedergabesignale nicht beeinflusst.
-
Durch
eine Codierung jedes Zeitblocks in Verbindung mit einem eine voreingestellte
Anzahl von Bits aufweisenden Rahmen kann die Aufzeichnungsposition
eines beliebigen Transformationsblocks leicht berechnet werden.
wenn die Codekette in einem Aufzeichnungsmedium wie beispielsweise einer
optischen Platte zu einer Erleichterung eines wahlfreien Zugriffs,
das heißt
einer Wiedergabe von einer beliebigen Position aufgezeichnet wird. Üblicherweise
wird zur Verbesserung der Tonqualität zur Minimierung des Leerbereichs
in jedem Rahmen eine größere Anzahl
von Bits effektiv genutzt.
-
Die 10 und 11 stellen
ein Beispiel eines Aufzeichnungsformats dar, wenn Daten des in 9 gezeigten
Rahmens chronologisch aufgezeichnet werden. 10 zeigt
ein Beispiel, bei dem der linke (L-) und rechte (R-) Kanal von Rahmen
zu Rahmen alternierend aufgezeichnet sind, und 11 zeigt
Signale, die Abtastwerte aufweisen, die bei einem (L+R)/2-en eines
L- und R-Kanals (= (L+R)/2-ing L
and R channels) von Rahmen zu Rahmen erzeugt werden. Der bei einem
(L+R)/2-en eines L- und R-Kanals auf diese Weise von Rahmen zu Rahmen erhaltene
Kanal wird hier als (L+R)-Kanal bezeichnet. Ähnlich wird der bei einem (L-R)/2-en eines
L- und R-Kanals auf diese Weise von Rahmen zu Rahmen erhaltene Kanal
hier als (L-R)-Kanal bezeichnet.
-
Durch
Anwenden des wie in 10 gezeigten Aufzeichnungsformats
können
die zwei Kanäle von
L und R auf dem gleichen Aufzeichnungsmedium aufgezeichnet werden.
Wenn das in 11 gezeigte Aufzeichnungsformat
benutzt wird, bei dem zwei Kanäle
von L und R von Rahmen zu Rahmen alternierend aufgezeichnet sind,
können
Doppelzeitsignale aufgezeichnet/wiedergegeben werden, wobei eine Wiedergabe
ohne Verkomplizierung der Wiedergabeschaltung realisiert werden
kann.
-
Obgleich
die in Bezug auf 9 erläuterte Technik oben beschrieben
worden ist, kann die Codierungseffizienz über das Codierungsverfahren nach 9 hinaus
verbessert werden.
-
Beispielsweise
kann die Codierungseffizienz durch Anwenden der sogenannten Variabelcodierungstechnik
einer Zuteilung kürzerer
und längerer Codelängen für die Signale
höherer
bzw. niedriger Auftrittswahrscheinlichkeit verbessert werden.
-
Auch
kann, wenn der oben erwähnte
voreingestellte Transformationsblock beim Codieren von Eingangssignalen,
das heißt
die Zeitblocklänge
für eine
orthogonale Transformation länger
ist, die Menge der subsidiären
Information wie beispielsweise der Quantisierungsfeinheitsinformation
oder der Normierungskoeffizienteninformation pro Block reduziert werden,
wobei die Frequenzauflösung
feiner gesteuert werden kann und dadurch die Codierungseffizienz verbessert
wird.
-
Wenn
außerdem
ein aus der PCT-Anmeldung der Internationalen Veröffentlichung
WO94/28633 des hier genannten
Rechtsinhabers hervorgehendes Verfahren, das heißt ein Verfahren zum wahrnehmbaren
Separieren von entscheidenden tonalen Komponenten (crucial tonal
components), die Signalkomponenten sind, bei denen die Energie bei
einer spezifizierten Frequenz konzentriert ist, von den Spektralsignalkomponenten
und Codieren der separierten Tonkomponenten unabhängig von
den verbleibenden Spektralsignalkomponenten angewendet wird, kann
eine effiziente Codierung mit einem hohen Kompressionsverhältnis ohne
wesentliche Erzeugung einer wahrnehmbaren Verschlechterung von Audiosignalen
realisiert werden.
-
Das
Verfahren zum Separieren der tonalen Signalkomponenten und Codieren
der separierten Signalkomponenten wird anhand von 12 erläutert. Beim
Beispiel von 12 ist von den Spektralsignalkomponenten
ein Satz aus drei tonalen Komponenten als tonale Signalkomponenten
separiert worden. Die jede tonale Komponente bildenden Signalkomponenten
werden zusammen mit jeweiligen Positionsdaten auf der Frequenzachse
der tonalen Komponenten codiert.
-
Generell
müssen
die Signalkomponenten der tonalen Komponenten, bei denen die Energie
in einer relativ kleinen Anzahl von spektralen Komponenten konzentriert
ist, zum Vermeiden einer Tonqualitätsverschlechterung mit einer
extrem hohen Präzision
quantisiert werden. Jedoch können
die Spektralkoeffizienten in jeder von den tonalen Komponenten befreiten
Codierungseinheit ohne eine Verschlechterung der wahrnehmbaren Tonqualität mit einer
relativ kleinen Anzahl von Bits quantisiert werden.
-
Wenn
zur Vereinfachung der Zeichnung in 12 nur
eine relativ kleine Anzahl von Spektralsignalkomponenten gezeigt
ist, so ist die Signalenergie in wenigen Signalkomponenten einer
Gruppe zu zehn von Signalkomponenten konzentriert, die eine gegebene
Codierungseinheit bildet. Deshalb wird als ein Resultat einer Separation
der tonalen Komponenten die Menge von Daten nicht signifikant erhöht, so dass
durch Separieren der tonalen Komponenten die Codierungseffizienz
als Ganzes verbessert werden kann.
-
13 zeigt
einen illustrativen Aufbau einer Codekette im Fall einer Codierung
durch das anhand der 12 erläuterte Verfahren. Bei dem vorliegenden
illustrativen Aufbau ist am vorderen Ende jedes Rahmens die Steuerungsdaten
wie beispielsweise Syncsignale und die codierte Anzahl der Codierungseinheiten,
die mit einer voreingestellten Anzahl von Bits codiert sind, aufweisende
Information als ein Headerabschnitt angeordnet. Nächst dem
Headerabschnitt ist Information, welche die codierten Tonalkomponentendaten
aufweist, als Tonalkomponentendaten angeordnet.
-
Als
Tonalkomponentendaten sind zuerst die Information, welche die codierte
Anzahl von Signalkomponenten in den tonalen Komponenten ist, angeordnet
und auf sie folgt die Information, welche die codierte Positionsinformation
der tonalen Komponenten auf der Frequenzachse ist, die Information, welche
die codierte Information bezüglich
den Normierungskoeffizienten ist, und die Information, welche die
normierte, quantisierte und codierte tonale Signalkomponente ist,
in dieser Reihenfolge.
-
Nächst den
Tonalkomponentendaten ist die Information angeordnet, welche die
codierten Daten des nach einer Subtraktion der tonalen Signalkomponenten
von den originalen Spektralsignalkomponenten verbleibenden Restsignals
ist. Dieses Restsignal kann auch als rauschige Signalkomponente
bezeichnet werden. Dieses Restsignal ist aus Quantisierungsfeinheitsdaten
und Normierungskoeffizientendaten jeder Codierungseinheit, Spektralkomponentensignalen,
die auf Basis der Normierungskoeffizientendaten und der Quantisierungsfeinheitsdaten (Signalkomponenten
anders als die tonalen Komponenten), die in der Reihenfolge der
zunehmenden Frequenz der Codierungseinheiten codiert sind, normiert
und quantisiert sind, zusammengesetzt. Es sei darauf hingewiesen,
dass Spektralsignalkomponenten der tonalen und anderen Signalkomponenten (Koeffizientendaten)
mittels VLC codiert sind.
-
14 zeigt
ein illustratives Beispiel der Signalkomponentencodierungsschaltung 111b von 2,
wenn die tonalen Signalkomponenten von den oben erwähnten jeweiligen
Signalkomponenten separiert werden.
-
Bei
der in 14 gezeigten Signalkomponentencodierungsschaltung 111b werden
die durch die Umsetzungsschaltung 111a von 2 gesendeten
Signalkomponenten 170a (110b) zu einer Tonalkomponentenseparationsschaltung 117a gesendet. Die
Signalkomponenten 170a werden in tonale Signalkomponenten 117b und
andere Signalkomponenten 170c (nicht-tonale Signalkomponenten)
separiert. Die tonalen Signalkomponenten 170b werden zu
einer Tonalkomponentencodierungsschaltung 117b gesendet,
während
die nicht-tonalen Signalkomponenten 170c zu einer Nichttonalkomponentencodierungsschaltung 117c gesendet
werden. Die Tonalkomponentencodierungsschaltung 117b und
die nicht tonal Komponentencodierungsschaltung 117c codieren
die ihnen zugeführten
Signalkomponenten, um resultierende Ausgangssignale 170d, 170e auszugeben.
Die Tonalkomponentencodierungsschaltung 117b erzeugt die
Information, welche die Tonalkomponentendaten von 13 bildet,
zur gleichen Zeit, zu der sie die Information codiert, welche die
Tonalkomponentendaten von 13 bildet.
Die Signalcodierungsanordnungen in der Tonalkomponentencodierungsschaltung 117b und
in der Nichttonalkomponentencodierungsschaltung 117c sind
die gleichen wie die in 4 gezeigten.
-
15 zeigt
ein illustratives Beispiel der Signalkomponentendecodierungsschaltung 114b im Fall,
bei dem die tonalen Signalkomponenten von den jeweiligen Signalkomponenten
separiert worden sind.
-
In
der in 15 gezeigten Signalkomponentendecodierungsschaltung 114b ist
der durch die Codekettenauflösungsschaltung 114a von 5 zugeführte Code 140a aus
den Tonalkomponentendaten 180a und Nichttonalkomponentendaten 180b gebildet,
die zu einer zugeordneten Tonalkomponentendecodierungsschaltung 118a bzw.
Nichttonalkomponentendecodierungsschaltung 118b gesendet
werden. Die Tonalkomponentendecodierungsschaltung 118a decodiert
die tonalen Signalkomponenten von den in 13 gezeigten
Tonalkomponentendaten, um resultierende tonale Signalkomponenten 180c auszugeben.
Die Nichttonalkomponentendecodierungsschaltung 118b decodiert
die tonalen Signalkomponenten von den Nichttonalenkomponentendaten,
um resultierende nicht-tonale
Signalkomponenten 180d auszugeben. Diese tonalen Signalkomponenten 180c und
die nicht-tonalen Signalkomponenten 180d werden beide zu
einer Spektralsignalsyntheseschaltung 118c gesendet, die
dann die tonalen Signalkomponenten und die nicht-tonalen Signalkomponenten
auf Basis der oben erwähnten
Positionsdaten synthetisiert, um die resultierenden Signalkomponenten 180e auszugeben.
Die Decodierungskonfigurationen der Tonalkomponentendecodierungsschaltung 118a und
der Nichttonalkomponentendecodierungsschaltung 118b sind
die gleichen wie die in 7 gezeigten.
-
Wenn
das Verfahren zur effizienten Codierung von Signalen jeweiliger
Kanäle
oben erläutert worden
ist, so ist auch ein Verfahren zur weiteren Verbesserung der Codierungseffizienz
durch Ausnutzen einer Signalkorrelation zwischen Kanälen bekannt.
Wenn beispielsweise, wenn die L-Kanal-Signale in der Wellenform
im Wesentlichen ähnlich
zu den R-Kanal-Signalen sind, anstelle einer Codierung des L- und R-Kanals Signale,
welche die Abtastwerte von (L+R)/2 aufweisen, und die, welche die
Abtastwerte von (L-R)/2 aufweisen, codiert werden, ist das Signal
(L-R)/2 von einem kleineren Wert, so dass eine Codierung mit einer
kleineren Anzahl von Bits ausgeführt
werden kann.
-
16 zeigt
einen illustrativen Aufbau einer Codierungseinrichtung zur Codierung
durch das oben erwähnte
Verfahren.
-
Nach 16 setzt
eine Kanalumsetzungsschaltung 119a ein L-Kanal-Signal 190a und
ein R-Kanal-Signal 190b in ein (L+R)-Kanal-Signal 190c (ein
Signal, das einen abgetasteten Wert von (L-R)/2 aufweist) und ein
(L-R)-Kanal-Signal 190d (ein Signal. das einen abgetasteten
Wert von (L-R)/2 aufweist) um.
-
Das
Signal 190c des (L+R)-Kanals und das Signal 190d des
(L-R)-Kanals werden zu den jeweiligen Umsetzungsschaltungen 119b bzw. 119c gesendet,
um wie in der Umsetzungsschaltung 111a von 2 umgesetzt
zu werden.
-
Die
Signalkomponenten 190e aus der Umsetzungsschaltung 119b und
die Signalkomponenten 190f aus der Umsetzungsschaltung 119c werden
zu jeweiligen Signalkomponentencodierungsschaltungen 119e bzw. 119f gesendet.
Diese Signalkomponentencodierungsschaltungen 119e und 119f arbeiten ähnlich wie
die Signalkomponentencodierungsschaltung 111b von 2.
Die Signalkomponenten 190e, 190f werden auch zur
Steuerungsschaltung 119d gesendet.
-
Die
Steuerungsschaltung 119d bestimmt die Anzahl 190g von
zugeteilten Bits bei der Codierung der Signalkomponenten des (L+R)-Kanals
in der Signalkomponentencodierungsschaltung 119e bzw. die Anzahl 190h von
zugeteilten Bits bei der Codierung der Signalkomponenten des (L-R)-Kanals
in der Signalkomponentencodierungsschaltung 119f auf Basis der
Signalkomponenten 190e bzw. 190f der Umsetzungsschaltungen 119b bzw. 119c.
Während
dieser Bitanzahlentscheidung können
die ganzen Bits auch so zugeteilt werden, dass die Anzahl von Bits
im richtigen Verhältnis
zu den Signalenergien in jedem Kanal ist.
-
Infolgedessen
codieren die Signalkomponenten 190e, 190f die
Signalkomponenten 190e für den (L+R)-Kanal und die Signalkomponenten 190f für den (L-R)-Kanal
auf Basis der Anzahlen 190g, 190h von zugeteilten
Bits, wie sie durch die Steuerungsschaltung 119d bestimmt
werden.
-
Die
Codierung durch die Signalkomponentencodierungsschaltungen 119e, 119f erzeugt
Codes 190i, 190j, von denen beide zu einer Codekettenerzeugungsschaltung 119g gesendet
werden. Diese Codekettenerzeugungsschaltung 119g erzeugt
von den jeweiligen Codes 190i bzw. 190j des (L+R)-
und (L-R)-Kanals eine Codekette 190k und gibt sie aus.
-
17 zeigt
einen illustrativen Aufbau einer zur Decodierung einer durch die
in 16 gezeigten Codierungseinrichtung erzeugten Codekette 190k adaptierten
Decodierungsschaltung.
-
Bei 17 separiert
eine Codekettenseparationsschaltung 211a von der Codekette 210a,
welche die oben erwähnte
Codekette 190k ist, ein Signal 210b des (L+R)-Kanals
und ein Signal 210c des (L-R)-Kanals. Der Code 210b des
(L+R)-Kanals und das Signal 210c des (L-R)-Kanals werden
zu den jeweiligen Signalkomponentendecodierungsschaltungen 211b bzw. 211c gesendet.
Diese Signalkomponentendecodierungsschaltungen 211b und 211c decodieren
die Codes ähnlich
wie die Signalkomponentendecodierungsschaltung 114b von 5.
-
Die
Signalkomponente des (L+R)-Kanals und die Signalkomponente des (L-R)-Kanals, die durch
Decodierung durch die Signalkomponentendecodierungsschaltungen 211b und 211c erhalten
werden, werden zu zugeordneten Inverstransformationsschaltungen 211d bzw. 211e gesendet.
Die Inverstransformationsschaltungen 211d, 211e führen eine
inverse Transformation ähnlich
wie die in 5 gezeigte Inverstransformationsschaltung 114c aus.
-
Das
durch die inverse Transformation durch die Inverstransformationsschaltung 211d erhaltene Signal 210f des
(L+R)-Kanals und das durch die inverse Transformation durch die
Inverstransformationsschaltung 211e erhaltene Signal 210g des (L-R)-Kanals
werden beide zu einer Kanalumsetzungsschaltung 211f gesendet,
welche die (L+R)-Kanal-Signale und die (L-R)-Kanal-Signale in ein
L-Kanal-Signal 210h und ein R-Kanal-Signal 210i umsetzt,
die ausgegeben werden.
-
Zusätzlich zu
dem oben beschriebenen Verfahren ist auch ein Verfahren zur effizienten
Codierung der L- und R-Kanal-Signale durch Ausnutzung von Charakteristiken
des menschlichen Gehörsystems
bekannt. Dieses Verfahren realisiert eine effiziente Codierung durch
Ausnutzung der Tatsache, dass die Phasendifferenz der L- und R-Kanal-Signale zum
psychoakustischen Stereoeffekt hauptsächlich in dem Fall, bei dem
die Signale Niedrigbereichsignale sind, beiträgt. Insbesondere werden die
Signale sowohl des L- als auch R-Kanals auf der Niedrigfrequenzseite
codiert, und auf der Hochbereichsseite wird die Signalwellenform
des (L+R)-Kanals unter Benutzung der für den L- und R-Kanal unterschiedlichen
Normierungskoeffizienten normiert und quantisiert.
-
18 zeigt
einen illustrativen Aufbau einer dieses Verfahrens zur Codierung
anwendenden Codierungseinrichtung.
-
In
die in 18 gezeigte Codierungseinrichtung
werden ein L-Kanal-Signal 220a und ein R-Kanal-Signal 220b eingegeben
und durch jeweils zugeordnete Transformationsschaltungen 221a bzw. 221b für eine Transformation
wie durch die jeweiligen Transformationsschaltungen 221a bzw. 221b transformiert.
Diese Transformationsschaltungen 221a, 221b geben
Signalkomponenten der jeweiligen Kanäle 220c, 220d aus,
die zu den zugeordneten Signalkomponentencodierungsschaltungen 220f, 220g gesendet
werden. Die Signalkomponentencodierungsschaltungen 221f, 221g werden
nachfolgend als B-Typ-Signalkomponentencodierungsschaltungen
bezeichnet. Diese B-Typ-Signalkomponentencodierungsschaltungen 221f, 221g codieren
Niedrigbereichsignalkomponenten der L-Kanal-Signalkomponenten 220c bzw.
der R-Kanal-Signalkomponenten 220d.
-
Die
Signalkomponenten der jeweiligen Kanäle 220c, 220d aus
den zugeordneten Transformationsschaltungen 221a, 221b werden
auch zu einer Kanalsyntheseschaltung 221d gesendet, welche
die L-Kanal-Signalkomponenten 220c und die R-Kanal-Signalkomponenten 220d zusammensummiert, um
(L+R)-Kanal-Signalkomponenten 220h zu
erzeugen. Diese (L+R)-Kanal-Signalkomponenten 220h werden
zu einer B-Typ-Signalkomponentencodierungsschaltung 221e gesendet.
Die B-Typ-Signalkomponentencodierungsschaltung 220e wird
nachfolgend als eine A-Typ-Signalkomponentencodierungsschaltung
bezeichnet.
-
Diese
A-Typ-Signalkomponentencodierungsschaltung 220e normiert
und quantisiert die Hochbereichseitesignalkomponenten der wie oben beschriebenen
(L+R)-Kanal-Signalkomponenten unter Benutzung der für den L-
und R-Kanal unterschiedlichen Normierungskoeffizienten.
-
Die
Steuerungsschaltung 221c ist im Wesentlichen ähnlich zur
Steuerungsschaltung 119d von 16. Die
Steuerungsschaltung 211c der 18 bestimmt
die zugeteilte Anzahl 220e von Bits zur Codierung für den (L+R)-Kanal
durch die Kanalsyntheseschaltung 211d, die zugeteilte Anzahl 220f von
Bits zur Codierung für
die L-Kanal-Signalkomponenten 220c und die zugeteilte Anzahl 220g von
Bits zur Codierung für
die R-Kanal-Signalkomponenten 220d.
-
Deshalb
codieren die A-Typ-Signalkomponentencodierungsschaltung 221e und
die B-Typ-Signalkomponentencodierungsschaltungen 221f, 221g die
(L+R)-Kanal-Signalkomponenten 220h,
L-Kanal-Signalkomponenten 220c und die R-Kanal-Signalkomponenten 220d auf
Basis der zugeordneten Anzahlen 220e, 220f und 220g von
Bits, die durch die Steuerungsschaltung 221c bestimmt werden.
-
Die
Codierung durch die A-Typ-Signalkomponentencodierungsschaltung 221e und
die B-Typ-Signalkomponentencodierungsschaltungen 221f, 221g resultieren
in einer Bildung von Codes 220k, 220l und 220m,
die zu einer Codekettenerzeugungsschaltung 221h gesendet
werden. Die Codekettenerzeugungsschaltung erzeugt dann von den Codes 220k, 220l und 220m eine
Codekette 220n zur Ausgabe der erzeugten Codekette 220n.
-
19 zeigt
einen illustrativen Aufbau der A-Typ-Signalkomponentencodierungsschaltung 221e in
der Konfiguration von 18. Die Signalkomponentencodierungsschaltung 221e von 19 ist
grundsätzlich
von einem Aufbau ähnlich
zum Aufbau der in 4 gezeigten Signalkomponentencodierungsschaltung,
wobei der Unterschied besteht, dass das Ausgangssignal der Signalkomponentencodierungsschaltung 221e ohne
die Normierungskoeffizienteninformation ist.
-
Bei 19 wird
die Signalkomponente 230a, welche die Signalkomponente 220h des
(L+R)-Kanals von der Signalsyntheseschaltung 221d ist,
von einem voreingestellten Band zu einem anderen durch eine Normierungsschaltung 231a normiert
und zu einer Quantisierungsfeinheitsentscheidungsschaltung 231b gesendet.
Die Quantisierungsfeinheitsentscheidungsschaltung 231b berechnet
die Quantisierungsfeinheitsinformation 230e auf Basis der
oben erwähnten
Signalkomponenten 230a und der Anzahl 230b von
zugeteilten Bits die mit der oben erwähnten Anzahl 220e von
zugeteilten Bits korrespondiert.
-
Die
normierten Spektralkoeffizientendaten 230c aus der Normierungsschaltung 231a und
die Quantisierungsfeinheitsinformation 230e aus der Quantisierungsfeinheitsentscheidungsschaltung 231b werden
zu einer Quantisierungsschaltung 231c gesendet, die dann
die normierten Spektralkoeffizientendaten 230c auf Basis
der Quantisierungsfeinheitsinformation 230e quantisiert.
Die Quantisierung durch die Quantisierungsschaltung 231c ergibt
Codes 230f, die als Codes 220k von 18 simultan mit
der Quantisierungsfeinheitsinformation 230e ausgegeben
werden.
-
20 zeigt
einen illustrativen Aufbau der B-Typ-Signalkomponentencodierungsschaltungen 221f, 221g.
-
Bei 20 separieren
die B-Typ-Signalkomponentencodierungsschaltungen Signalkomponenten 220a,
die das L-Kanal-Signal 220c aus der Transformationsschaltung 221a von 18 oder
die R-Kanal-Signalkomponenten 220d aus der Transformationsschaltung
sind, in Niedrigbereichsignalkomponenten 240c und Hochbereichsignalkomponenten 240d durch
eine Signalseparationsschaltung 241a.
-
Die
Niedrigbereichsignalkomponenten 240c werden durch die Normierungsschaltung 241b, Quantisierungsschaltung 241e und
die Quantisierungsfeinheitsentscheidungsschaltung 241d codiert. Die
Quantisierungsfeinheitsentscheidungsschaltung 241d bestimmt
die Quantisierungsfeinheit auf Basis der Anzahl 240b von
zugeteilten Bits zur Codierung aus der Steuerungsschaltung 221c von 18.
-
Andererseits
werden die Hochbereichseitesignalkomponenten 240d durch
die Normierungsschaltung 241c normiert, so dass nur normierte Spektralkoeffizientendaten
ausgegeben werden.
-
Die
Quantisierungsfeinheitsinformation 240f aus der Niedrigbereichseite-Quantisierungsfeinheitsentscheidungsschaltung 241d,
Codes 240h aus der Quantisierungsschaltung 241e,
Normierungskoeffizienteninformation 240i aus der Normierungsschaltung 241b und
die normierten Spektralkoeffizientendaten 240g aus der
Hochbereichseite-Normierungsschaltung 241c werden als Codes 220l oder 220m von 18 zu
einer Codekettenerzeugungsschaltung 221h von 18 gesendet.
-
21 zeigt
einen illustrativen Aufbau einer durch die Codekettenerzeugungsschaltung 221h von 18 erzeugten
Codekette.
-
Bei 21 ist
die Codekette aus einem Header, der aus Synchronisationssignalen
und die Anzahl von Codierungseinheiten für den Niedrigfrequenzbereich
zusammengesetzt ist, codierten Daten der Niedrigbereichsseite des
ersten Kanals (L-Kanal), codierten Daten der Niedrigbereichsseite
des zweiten Kanals (R-Kanal) und codierten Daten der Hochbereichsseite
gebildet. Was die Niedrigbereichsseite betrifft, so sind Quantisierungsfeinheitsdaten,
Normierungskoeffizientendaten und Spektralkoeffizientendaten als
unabhängige
codierte Daten für
den ersten Kanal (L-Kanal) und für
den zweiten Kanal (R-Kanal) gegeben. Was jedoch die Hochbereichsseite
betrifft, so sind mit Ausnahme der Normierungskoeffizienteninformation
für den
ersten Kanal (L-Kanal) und den zweiten Kanal (R-Kanal) Daten gegeben,
den zwei Kanälen
(erster und zweiter Kanal) gemeinsam sind. Infolgedessen sind in 21 die
Quantisierungsfeinheitsinformation und die Spektralkoeffizientendaten
gemeinsame Daten für
den ersten und zweiten Kanal.
-
22 zeigt
einen illustrativen Aufbau einer zur Decodierung codierter Daten
der in 21 gezeigten Codekette konfigurierten
Decodierungseinrichtung.
-
Bei 22 werden
codierte Daten 250a der in 21 gezeigte
Codekette durch eine Codekettenseparationsschaltung 251a in
einen L- und R-Kanal separiert. Jedoch werden Hochbereichsdaten, die
gemeinsame Daten für
die zwei Kanäle
sind, zu beiden Signalkomponentendecodierungsschaltungen 251b und 251c gesendet.
Die L-Kanal-codierten Daten 250b werden
von einer Signalkomponentendecodierungsschaltungen 251b decodiert,
während die
R-Kanal-codierten
Daten 250c von einer Signalkomponentendecodierungsschaltung 251c decodiert werden.
-
Die
von diesen Signalkomponentendecodierungsschaltungen 251b, 251c decodierten
Signalkomponenten 250d, 250e werden zu zugeordneten Inverstransformationsschaltungen 251d, 251e gesendet,
wo die Signalkomponenten zu einer Wiederherstellung der L-Kanal-Zeitbereichssignale 250f und der
R-Kanal-Zeitbereichssignale
invers transformiert werden.
-
Bei
dem wie anhand der 16 erläuterten Verfahren zur Codierung
der mit dem (L+R)-Kanal und dem (L-R)-Kanal für den ganzen Bereich korrespondierenden
Kanal missen diese zwei Kanäle
codiert werden, selbst wenn einer der Kanäle von einem niedrigen Signalpegel
ist. Dies auferlegt bei einer Verbesserung der Kompressionseffizienz
durch eine Codierung eine Grenze. Bei dem wie in 18 erläuterten
Verfahren zur Codierung nur der Normierungskoeffizienten für die Hochbereichseite
ist eine korrespondierende Anzahl von Bits zur Codierung der Normierungskoeffizienten
des ganzen Bereichs erforderlich. Auch muss bei dem oben beschriebenen
Verfahren eine Transformationsverarbeitung und inverse Transformationsverarbeitung
für den
ganzen Frequenzbereich für
sowohl den L- als auch R-Kanal ausgeführt werden, wodurch eine voluminöse Verarbeitung
und Pufferspeicherraum erforderlich ist.
-
Infolgedessen
werden bei der vorliegenden Ausführungsform
sowohl die L- als auch R-Kanal-Signale oder Signale, die zu einer
Wiederherstellung der L- und R-Signale
fähig sind,
für die
Niedrigbereichseite codiert. Andererseits werden, was die Hochbereichsignale
betrifft, gemeinsame Signale für den
L- und R-Kanal benutzt oder die gemeinsamen Signale für den L-
und R-Kanal, die nur im Signalpegel modifiziert sind, werden so
adaptiert, dass sie sowohl zur Realisierung einer hocheffizienten
Codierung als auch zur Reduzierung des Volumens der Verarbeitung
für die
Decodierung und Codierung wiedergegeben werden. Dies wird anhand
der Zeichnungen erläutert.
-
23 zeigt
einen illustrativen Aufbau einer zur Ausführung der Codierung mittels
des oben beschriebenen Verfahrens adaptierte Codierungseinrichtung.
-
Bei 23 werden
das L-Kanal-Signal 260a und das R-Kanal-Signal 260b einer
jeweiligen Transformationsschaltung 261a bzw. 261b zugeführt. Diese
Transformationsschaltungen 261a, 261b sind ähnlich zu
den vorher beschriebenen und führen
eine Transformationsverarbeitung für die jeweiligen Eingangssignale
aus. Die durch die Transformationsschaltung 261a transformierten
L-Kanal-Signalkomponenten 260c werden zu einer Niedrigbereichsignalseparationsschaltung 261g gesendet,
während die
durch die Transformationsschaltung 261b transformierten
R-Kanal-Signalkomponenten 260d zu
einer Niedrigbereichsignalseparationsschaltung 261h gesendet
werden.
-
Die
Niedrigbereichsignalseparationsschaltungen 261g, 261h separieren
nur die Signalkomponenten der Niedrigbereichseite der zugeführten Signalkomponenten,
um die separierten Niedrigbereichsignale als Niedrigbereichsignale 260j, 260k zu
den zugeordneten Signalkomponentencodierungsschaltungen 261j, 261k zu übertragen.
-
Die
Signalkomponentencodierungsschaltung 261j, der die niedrigbereichseitigen
L-Kanal-Signalkomponenten 260j zugeführt werden, und die Signalkomponentencodierungsschaltung 261k,
der die niedrigbereichseitigen R-Kanal-Signalkomponenten 260k zugeführt werden,
codieren Niedrigbereichsignalkomponenten der L- und R-Kanäle. Die
Signalkomponentencodierungsschaltungen 261j, 261k geben
Codes 260m, 260n aus, die zu einer Codekettenerzeugungsschaltung 261l gesendet
werden.
-
Wenn
die Niedrigbereichsignalkomponenten der L- und R-Kanäle codiert
sind, ist es möglich,
Signale zu codieren, die zur Wiederherstellung von Niedrigbereichsignalkomponenten
sowohl des L- als auch R-Kanals fähig sind.
-
Die
Signalkomponenten der jeweiligen Kanäle 260c, 260d aus
den Transformationsschaltungen 261a, 261b werden
beide zu einer Kanalsyntheseschaltung 261e gesendet, die
dann die Signalkomponenten 260c, 260d des L- und
R-Kanals summiert, um die resultierenden (L+R)-Kanal-Signalkomponenten 260h auszugeben.
Die (L+R)-Kanal-Signalkomponenten 260h werden einer Hochbereichsignalseparierungsschaltung 261f zugeführt.
-
Die
Hochbereichsignalseparierungsschaltung 261f separiert nur
die hochbereichseitigen Signalkomponenten der zugeführten (L+R)-Kanal- Signalkomponenten 260h,
um Hochbereichsignalkomponenten 260i zu erzeugen, die zu
einer Signalkomponentencodierungsschaltung 261i gesendet
werden.
-
Die
Signalkomponentencodierungsschaltung 261i codiert die (L+R)-Kanal-Hochbereichsignalkomponenten 260i,
um Hochbereichcodes 260i zu erzeugen, die zu einer Codekettenerzeugungsschaltung 261l gesendet
werden.
-
Wenn
die (L+R)-Kanal-Hochbereichsignalkomponenten, die dem L- und R-Kanal gemeinsame Signale
sind, codiert werden, so ist es auch möglich, Signale zu codieren,
die dem L- und R-Kanal gemeinsam sind und die nur bezüglich des
Signalpegels modifiziert sind.
-
Die
Steuerungsschaltung 261c bestimmt die zugeteilte Anzahl 260e von
Bits zur Codierung für
die Hochbereichsignalkomponenten 260i für den (L+R)-Kanal, die zugeteilte
Anzahl 260f von Bits zur Codierung für die Niedrigbereichsignalkomponenten 260j für den L-Kanal
und die zugeteilte Anzahl 260g von Bits zur Codierung für die Niedrigbereichsignalkomponenten 260k für den R-Kanal.
Das besondere Verfahren zur Steuerung der zugeteilten Anzahl von Bits
zur Codierung durch die Steuerungsschaltung 261c wird später speziell
erläutert.
-
Deshalb
codieren die Signalkomponentencodierungsschaltungen 261i, 261j und 261k die Hochbereichsignalkomponenten 260i für den (L+R)-Kanal,
die Niedrigbereichsignalkomponenten 260j für den L-Kanal
bzw. die Niedrigbereichsignalkomponenten 260k für den R-Kanal
auf Basis der zugeteilten Anzahlen 260e, 260f und 260g von
Bits, wie sie durch die oben erwähnte
Steuerungsschaltung 261c bestimmt werden.
-
Die
oben erwähnte
Codekettenerzeugungsschaltung 261l erzeugt von den Codes 260l, 260m und 260n,
die von den Signalkomponentencodierungsschaltungen 261i, 261j bzw. 261k zugeführt werden,
eine Codekette 260o.
-
24 zeigt
einen illustrativen Aufbau der Signalkomponentencodierungsschaltungen 261i, 261j und 261k von 23.
-
Bei 24 werden
eine Signalkomponente 270a, die eine von den Hochbereichsignalkomponenten 260i für den (L+R)-Kanal,
den Niedrigbereichsignalkomponenten 260j für den L-Kanal
und den Niedrigbereichsignalkomponenten 260k für den R-Kanal
ist, durch eine Normierungsschaltung 271a von einem voreingestellten
Band zu einem anderen normiert, wobei sie zu einer Quantisierungsfeinheitsentscheidungsschaltung 271b gesendet
wird. Diese Quantisierungsfeinheitsentscheidungsschaltung 271b berechnet die
Quantisierungsfeinheitsinformation 270d auf Basis der Signalkomponenten 270a und
der Signalkomponente 270b, die mit einer der zugeteilten
Anzahlen 260e, 260f und 260g von Bits zur
Codierung korrespondiert.
-
Die
normierten Spektralkoeffizientendaten 270c aus der Normierungsschaltung 271a und
die Quantisierungsfeinheitsinformation 270d aus der Quantisierungsfeinheitsentscheidungsschaltung 271b werden
zu einer Quantisierungsschaltung 271c gesendet. Die Quantisierungsschaltung 271c quantisiert
die normierten Spektralkoeffizientendaten 270c auf Basis
der Quantisierungsfeinheitsinformation 270d. Die quantisierten
Codes 270e aus der Quantisierungsschaltung 271c werden
simultan mit der oben erwähnten
Quantisierungsfeinheitsinformation 270d und Normierungskoeffizienteninformation 270f als
einer von den Codes 260l, 260m und 260n ausgegeben.
-
25 zeigt
ein Verarbeitungsbeispiel zum Finden von Daten bezüglich der
Anzahl von benutzbaren Bits, die durch die Steuerungsschaltung 261c von 23 den
Signalkomponentencodierungsschaltungen 261i, 261j und 261k in
jedem Rahmen zugeteilt werden. Diese Anzahl von benutzbaren Bits ist
die durch die oben erwähnten
Anzahlen 260e, 260f und 260g von zugeteilten
Bits spezifizierte. Bei 25 sind
die Daten bezüglich
der Anzahl von rahmenbasierten benutzbaren Bits für die Hochbereichsignalkomponenten 260i des
(L+R)-Kanals als Bh spezifiziert, während die Daten bezüglich der
Anzahl von rahmenbasierten benutzbaren Bits für die Niedrigbereichsignalkomponenten 260j des
L-Kanals als B1 spezifiziert ist und die Daten bezüglich der
Anzahl von rahmenbasierten benutzbaren Bits für die Niedrigbereichsignalkomponenten 260k des
R-Kanals als B2 spezifiziert ist. Das heißt die Anzahl von Bits, die durch
die Daten bezüglich
der Anzahl Bh von Bits spezifiziert ist, korrespondiert mit der
rahmenbasierten Anzahl von Bits des durch die Signalkomponentencodierungsschaltung 261i von 23 ausgegebenen
Codes 260l, während
die Anzahl von Bits, die durch die Daten bezüglich der Anzahl B1 von Bits spezifiziert
ist, mit der rahmenbasierten Anzahl von Bits des durch die Signalkomponentencodierungsschaltung 261j von 23 ausgegebenen
Codes 260m korrespondiert und die Anzahl von Bits, die durch
die Daten bezüglich
der Anzahl B2 von Bits spezifiziert ist, mit der rahmenbasierten
Anzahl von Bits des durch die Signalkomponentencodierungsschaltung 261k von 23 ausgegebenen
Codes 260n korrespondiert.
-
Nach 25 wird
die Hochbereichsseitesignalenergie Eh des (L+R)-Kanals beim Schritt
S101 gefunden. Die Signalenergie E1 des Niedrigbereichseitesignals
des L-Kanals wird beim Schritt S102 gefunden und die Energie E2
des Niedrigbereichseitesignals des R-Kanals wird beim Schritt S103
gefunden.
-
Beim
Schritt S104 werden die auf diese Weise gefundenen Signalenergien
Eh, E1 und E2 mit einer einen Gewichtungskoeffizienten Ah für den (L+R)-Kanal,
einen Gewichtungskoeffizienten A1 für den L-Kanal und einen Gewichtungskoeffizienten
A2 für
den R-Kanal benutzenden gewichteten Addition verarbeitet, um die
Verarbeitungsresultate S zu finden.
-
Bei
den Schritten S105 und S106 wird die Gesamtzahl B von Bits, die
anderem als dem Headerabschnitt für den L- und R-Kanal zugeteilt
werden kann, als die oben erwähnten
Daten für
die Anzahlen B1 und B2 von Bits verteilt, um im richtigen Verhältnis zur
Gewichtungsenergie der jeweiligen Codierungsabschnitte der Signalkomponentencodierungsschaltungen 261j, 261k zu
sein. Beim Schritt S107 werden die verbleibenden Teile der Gesamtzahl
von Bits durch die Signalkomponentencodierungsschaltung 261i dem
Codierungsabschnitt als die oben erwähnten Daten bezüglich der
Anzahl Bh von Bits zugeteilt.
-
26 zeigt
einen illustrativen Aufbau einer durch die Codierungseinrichtung
von 23 ausgegebenen Codekette.
-
Bei 26 ist
die Codekette aus einem Header, der aus Synchronisationssignalen
und der Anzahl von Niedrigbereichcodierungseinheiten zusammengesetzt
ist, niedrigbereichseitecodierten Daten des ersten Kanals (L-Kanal)
(Quantisierungsfeinheitsinformation, Normierungskoeffizienteninformation
und Spektralkoeffizientendaten), niedrigbereichsseitecodierten Daten
des zweiten Kanals (R-Kanal) (Quantisierungsfeinheitsinformation,
Normierungskoeffizienteninformation und Spektralkoeffizientendaten)
und niedrigbereichsseitecodierten Daten des (L+R)-Kanals (Quantisierungsfeinheitsinformation, Normierungskoeffizienteninformation
und Spektralkoeffizientendaten) gebildet. Bei 26 kann,
da im Gegensatz zur Codekette von 21 ein
einzelner Kanal der Hochbereichseitenormierungskoeffizienteninformation
genügt,
die Codierung mit einer kleineren Anzahl von Bits ausgeführt werden.
Wenn die Hochbereichseitesignale gemeinsam benutzt werden, ist das
Ausbreitungsgefühl
(spread-out feeling) des Tons etwas verschlechtert. Jedoch kann
der Benutzer noch eine Stereotonwiedergabe genießen, da es eher die Niedrigbereichseitesignale
als die Hochbereichseitesignale sind, die bei der Zunahme des Stereophontongefühls instrumentaler
sind.
-
27 zeigt
einen illustrativen Aufbau einer Decodierungseinrichtung zur Decodierung
der in 26 gezeigten Codekette.
-
Bei 27 werden
codierte Daten 280a der in 26 gezeigten
Codekette durch eine Codekettenseparierungsschaltung 281a in
den Hochbereichseite-(L+R)-Kanal
und den Niedrigbereichseite-R-Kanal separiert. Codierte Daten 280b des
Hochbereichseite-(L+R)-Kanals werden von einer Signalkomponentendecodierungsschaltung 281b decodiert,
während
codierte Daten 280c des Niedrigbereichseite-L-Kanals von
einer Signalkomponentendecodierungsschaltung 281c decodiert
werden und codierte Daten 280d des Niedrigbereichseite-R-Kanals
von einer Signalkomponentendecodierungsschaltung 281d decodiert
werden.
-
Die
Signalkomponenten 280e, 280f des Hochbereichseite-(L+R)-Kanals
und des Niedrigbereichseite-L-Kanals, die von den jeweiligen Signalkomponentendecodierungsschaltungen 281b bzw. 281c decodiert
werden, werden zu einer Signalkomponentensyntheseschaltung 281e gesendet.
Die Signalkomponenten 280e, 280f des Hochbereichseite-(L+R)-Kanals
und Niedrigbereichseite-R-Kanals, die von den jeweiligen Signalkomponentendecodierungsschaltungen 281b bzw. 281d decodiert
werden, werden zu einer Signalkomponentensyntheseschaltung 281f gesendet.
-
Die
Signalkomponentensyntheseschaltung 281e synthetisiert die
Signalkomponenten 280e des Hochbereichseite-(L+R)-Kanals
und die Signalkomponenten 280f des Niedrigbereichseite-L-Kanals,
um die Niedrigbereich- und
Hochbereichseite zu synthetisieren und die L-Kanal-Signalkomponenten 280h des
aus der Synthese resultierenden ganzen Bereichs zu einer Inverstransformationsschaltung 281h zu
senden.
-
Die
Signalkomponentensyntheseschaltung 281f synthetisiert die
Signalkomponenten 280e des Hochbereichseite-(L+R)-Kanals
und die Signalkomponenten 280g des Niedrigbereichseite-R-Kanals, um
die Niedrigbereich- und
Hochbereichseite zu synthetisieren und die L-Kanal-Signalkomponenten 280i des
aus der Synthese resultierenden ganzen Bereichs zu einer Inverstransformationsschaltung 281i zu
senden.
-
Diese
Inverstransformationsschaltungen 281h, 281i invers-transformieren
Signalkomponenten des L- und R-Kanals des ganzen Bereichs, um Zeitbereichsignale 280j des
L-Kanals und Zeitbereichsignale 280k des R-Kanals wiederherzustellen.
-
Wie
aus der vorhergehenden Beschreibung hervorgeht können durch das die vorliegende
Erfindung realisierende Verfahren Stereosignale mit einer kleineren
Anzahl von Bits codiert werden.
-
Auch
das Verarbeitungsvolumen und das Pufferspeichervolumen können effektiv
erniedrigt werden. Diese Modifikation zur Erniedrigung des Verarbeitungsvolumens
und des Pufferspeichervolumens wird nachfolgend erläutert.
-
28 zeigt
einen illustrativen Aufbau einer Codierungseinrichtung der Modifikation,
bei der die Verarbeitung durch ein Bandteilungsfilter und eine Vorwärtsorthogonaltransformationsschaltung
ist, die in Kombination benutzt werden.
-
Bei 28 werden
ein L-Kanal-Signal 290a und ein R-Kanal-Signal 290b zu
jeweiligen Bandteilungsfiltern 291a bzw. 291b gesendet.
Das Bandteilungsfilter 291a teilt das L-Kanal-Signal 290a in
Niedrigbereich- und Hochbereichsignale, während das Bandteilungsfilter 291b das
R-Kanal-Signal 290b in Niedrigbereich- und Hochbereichsignale
teilt.
-
Das
Niedrigbereichsignal des L-Kanals 290d, das vom Bandteilungsfilter 291a geteilt
ist, wird zu einer Vorwärtsorthogonaltransformationsschaltung 291e gesendet,
während
das Niedrigbereichsignal des R-Kanals 290f, das vom Bandteilungsfilter 291b geteilt
ist, zu einer Vorwärtsorthogonaltransformationsschaltung 290j gesendet
wird.
-
Die
bei der Teilung durch die Bandteilungsfilter 291a, 291b erhaltenen
L- und R-Kanal-Hochbereichsignale 290c, 290e werden
zu einer Kanalsyntheseschaltung 291c gesendet, um in ein
Hochbereichsignal des (L+R)-Kanals synthetisiert zu werden, der
zu einer Vorwärtsorthogonaltransformationsschaltung 291d gesendet
wird.
-
Diese
Vorwärtsorthogonaltransformationsschaltungen 291d, 291e, 291f verarbeiten
die Eingangssignale mit einer Vorwärtsorthogonaltransformation,
um Signalkomponenten 290h, 290i, 290j zu erzeugen,
die zu zugeordneten Signalkomponentencodierungsschaltungen 291h, 291i, 291j gesendet werden.
-
Die
Signalkomponenten 290h, 290i, 290j aus
den Vorwärtsorthogonaltransformationsschaltungen 291d, 291e, 291f werden
auch zu einer Steuerungsschaltung 291g gesendet. Die Steuerungsschaltung 291g bestimmt
wie im Fall der 23 die zugeteilte Anzahl 290k von
Bits zur Codierung für
die Hochbereichsignalkomponenten 290h des (L+R)-Kanals,
die zugeteilte Anzahl 290l von Bits zur Codierung für die Niedrigbereichsignalkomponenten 290i des
L-Kanals und die zugeteilte Anzahl 290m von Bits für die Niedrigbereichsignalkomponenten 290j des
R-Kanals auf Basis der Signalkomponenten 290h, 290i und 290j aus
den Vorwärtsorthogonaltransformationsschaltungen 291d, 291e und 290f.
-
Infolgedessen
codieren die oben erwähnten Signalkomponentencodierungsschaltungen 291h, 291i, 291j die
zugeordneten Hochbereichsignalkomponenten 290h des (L+R)-Kanals 290h,
Niedrigbereichsignalkomponenten 290i des L-Kanals und die Niedrigbereichsignalkomponenten 290j des
R-Kanals auf Basis der zugeteilten Anzahlen 290k, 290l und 290m von
Bits, wie sie durch die Steuerungsschaltung 291g gesetzt
werden.
-
Die
Codekettenerzeugungsschaltung 291k erzeugt von den Codes 290n, 290o und 290p aus den
Signalkomponentencodierungsschaltungen 291h, 291i, 291j eine
Codekette 290q ähnlich
zu der in 26 gezeigten und gibt die erzeugte
Codekette 290q aus.
-
Bei
dem Aufbau von 28 ist bemerkenswert, dass,
da die Vorwärtsorthogonaltransformation bezüglich der
Hochbereichseite bezüglich
beider Kanäle
(L+R-Kanal) gemeinsam ausgeführt
wird, eine Verarbeitung wie beispielsweise eine Codierung nur einmal
ausgeführt
werden muss, so dass das Verarbeitungsvolumen und der Pufferspeicherraum
gespart werden. Insbesondere müssen
bei dem oben beschriebenen Verfahren zur Ausgabe der in 21 gezeigten
Codekette, selbst wenn die Kombination aus dem Bandteilungsfilter
und den Vorwärtsorthogonaltransformationsschaltungen
als die Transformationsschaltung benutzt wird, die Normierungskoeffizientendaten
für den
L- und R-Kanal unabhängig
gefunden werden, so dass die Verarbeitung bezüglich zweier Kanäle inklusive
der Transformation bezüglich der
Hochbereichseite ausgeführt
werden muss. Bei dem beim Aufbau von 28 angewendeten
Verfahren reicht für
zwei Kanäle
nur eine Vorwärtsorthogonaltransformationsverarbeitungsoperation
für die Hochbereichseitesignale
aus.
-
29 zeigt
einen illustrativen Aufbau einer Decodierungseinrichtung, die zur
Decodierung einer durch die in 28 gezeigten
Codierungseinrichtung erzeugten Codekette adaptiert ist.
-
Bei 29 werden
codierte Daten 310a einer Codekette ähnlich zu einer in 26 gezeigten durch
eine Codekettenteilungsschaltung 311a in einen Hochbereichseite-(L+R)-Kanal
und Niedrigbereichseite-L- und -R-Kanal geteilt. Codierte Daten des
Hochbereichseite-(L+R)-Kanals 210b werden von einer Signalkomponentendecodierungsschaltung 311b decodiert,
während
codierte Daten des Niedrigbereichseite-L-Kanals 310c durch
eine Signalkomponentendecodierungsschaltung 311c und codierte
Daten des Niedrigbereichseite-R-Kanals 310d von einer Signalkomponentendecodierungsschaltung 311b decodiert
werden.
-
Die
Signalkomponenten 310e, 310f, 310g des
Hochbereichseite-(L+R)-Kanals, Niedrigbereichseite-L-Kanals und
des Niedrigbereichseite-R-Kanals, die von den Signalkomponentendecodierungsschaltungen 311b, 311c und 311d decodiert
sind, werden zu zugeordneten Inversorthogonaltransformationsschaltungen 311e, 311f und 311g zur
inversen orthogonalen Transformation gesendet.
-
Das
Signal des Hochbereichseite-(L+R)-Kanals 310h aus der Inversorthogonaltransformationsschaltung 311e und
das Signal des Niedrigbereichseite-R-Kanals 310i aus der
Inversorthogonaltransformationsschaltung 311f werden zu
einem Bandsynthesefilter 311h gesendet, das dann den Hochbereichseite-(L+R)-Kanal 310h und
den Niedrigbereichseite-R-Kanal 310i zur Synthetisierung
des niedrigen und hohen Bereichs synthetisiert, um die resultierenden
Vollbereichs-L-Kanal-Zeitbereichsignale 310k auszugeben.
-
Das
Signal des Hochbereichsseite-(L+R)-Kanals 310h aus der
Inversorthogonaltransformationsschaltung 311e und das Signal
des Niedrigbereichsseite-R-Kanals 310j aus der Inversorthogonaltransformationsschaltung 311g werden zu
einem Bandsynthesefilter 311i gesendet, das dann den Hochbereichsseite-(L+R)-Kanal 210h und den
Niedrigbereichsseite-R-Kanal 310j zur Synthetisierung des
niedrigen und hohen Bereichs synthetisiert, um die resultierenden
Vollbereich-R-Kanal-Zeitbereichssignale 310l auszugeben.
-
Es
ist zu sehen, dass es bei der in 29 gezeigten
Decodierungseinrichtung ausreicht, die hochbereichseitige inverse
orthogonale Transformation nur einmal als der gemeinsame (L+R)-Kanal auszuführen. Bei
dem Verfahren zur Decodierung der in 22 gezeigten
Codekette ist es notwendig, die inverse orthogonale Transsformationsverarbeitung
für den
L- und R-Kanal für
den ganzen Frequenzbereich unabhängig
auszuführen,
selbst wenn die Kombination aus der inversen orthogonalen Transformation
und dem Bandsynthesefilter wie oben als die Inverstransformationsschaltung
benutzt wird, da die Normierungskoeffizienten von Kanal zu Kanal
differieren. Bei dem oben beschriebenen Decodierungsverfahren ist
es möglich,
das Verarbeitungsvolumen und den Pufferspeicherraum zu sparen.
-
Die
in 26 gezeigte Codekette kann so wiedergegeben werden,
dass der Hochbereichseite-L- und -R-Kanal zur Verbesserung des Stereotongefühls von
einem unterschiedlichen Signalpegel sind.
-
30 zeigt
den Aufbau einer solchen Decodierungseinrichtung.
-
Bei 30 werden
codierte Daten 320 einer Codekette ähnlich zu der in 26 gezeigten
durch die Codekettenteilungsschaltung 321a in einen Hochbereichseite-(L+R)-Kanal
und in einen Niedrigbereichseite-R-Kanal geteilt. Die codierten
Daten 320b des Hochbereichseite-(L+R)-Kanals werden von
einer Signalkomponentendecodierungsschaltung 321b decodiert,
während
die codierten Daten 320c des Niedrigbereichseite-L-Kanals
von einer Signalkomponentendecodierungsschaltung 321c decodiert
werden und die codierten Daten 320d des Niedrigbereichseite-R-Kanals
von einer Signalkomponentendecodierungsschaltung 321d decodiert werden.
-
Die
Signalkomponenten 320e, 320f und 320g des
Hochbereichseite-(L+R)-Kanals,
Niedrigbereichseite-L-Kanals und des Niedrigbereichseite-R-Kanals
werden zu zugeordneten Inversorthogonaltransformationsschaltungen 321e, 321f und 321g zu
einer inversen orthogonalen Transformation gesendet.
-
Das
L-Kanal-Niedrigbereichsignal 320i aus der Inversorthogonaltransformationsschaltung 320f und
die Niedrigbereichseite-R-Kanal-Signale 320j aus
der Inversorthogonaltransformationsschaltung 321g werden
zu zugeordneten Bandsynthesefiltern 321k und 321l und
simultan zu einer Gewichtungsentscheidungsschaltung 321h gesendet.
Diese Gewichtungsentscheidungsschaltung 321h setzt Gewichtungskoeffizienten
für den
L- und R-Kanal,
um die so gesetzten Gesichtungskoeffizienten für den L- und R-Kanal zu zugeordneten
Gewichtungsschaltungen 321i, 321j zu senden.
-
Diesen
Gewichtungsschaltungen 321i, 321j werden durch
die Inversorthogonaltransformationsschaltung 321e Hochbereichsignale 320h des (L+R)-Kanals zugeführt. Diese
Gewichtungsschaltungen 321i, 321j führen beim
(L+R)-Kanal-Hochbereichsignal 320h eine
Gewichtung für
den L- und R-Kanal unabhängig
aus. Die durch die Gewichtungsschaltung 321i für den L-Kanal
gewichteten (L+R)-Kanal-Hochbereichsignale 320m werden
zum Bandsynthesefilter 321k gesendet, während die durch die Gewichtungsschaltung 321j für den R-Kanal
gewichteten (L+R)-Kanal-Hochbereichsignale 320n zum Bandsynthesefilter 321l gesendet
werden.
-
Das
heißt
bei der Decodierungseinrichtung von 30 bestimmt
die Gewichtungsschaltung 321h die Gewichtungskoeffizienten 320k, 320l aus den
Niedrigbereichseitesignalpegeln des L- und R-Kanals, während die
Gewichtungsschaltungen 321i, 321j die Abtastwerte
der jeweiligen Signale so korrigieren, dass sie im richtigen Verhältnis zu
den Gewichtungskoeffizienten 320k, 320l sind.
-
Das
Bandsynthesefilter 321k synthetisiert die für den L-Kanal
gewichteten Hochbereichsignale für
den (L+R)-Kanal 320m und die oben erwähnten Niedrigbereichsignale 320i des
L-Kanals mittels einer Synthese des niedrigen und hohen Bereichs,
um das resultierende L-Kanal-Zeitbereichsignal 320o des
ganzen Bereichs auszugeben.
-
Das
Bandsynthesefilter 321l synthetisiert die für den R-Kanal
gewichteten Hochbereichsignale für den
(L+R)-Kanal 320n und die oben erwähnten Niedrigbereichsignale
des R-Kanals mittels einer Synthese des niedrigen und hohen Bereichs,
um das resultierende R-Kanal-Zeitbereichssignal 320p des
ganzen Bereichs auszugeben.
-
31 zeigt
ein Verarbeitungsbeispiel, bei dem die Gewichtungsentscheidungsschaltung 321h der
Decodierungseinrichtung von 30 den
Gewichtungskoeffizienten 320k für den ersten Kanal (L-Kanal)
(in 31 als ein Gewichtungsparameter R1 angezeigt)
und den Gewichtungskoeffizienten 320l für den zweiten Kanal (R-Kanal)
(in 31 als Gewichtungsparameter R2 angezeigt) bestimmt.
-
Bei
dieser Verarbeitung wird die Hochbereichseitesignalenergie auch
auf den L- und R-Kanal verteilt, so dass sie im richtigen Verhältnis zur
Signalenergie auf der Niedrigbereichseite ist. Zu diesem Zweck wird
beim Schritt 201 unter Benutzung der L-Kanal-Niedrigbereichsignale 320i die
Hochbereichseitesignalenergie EI1 des L-Kanals gefunden, so dass die Signalenergie
EI1 im richtigen Verhältnis
zur Energie der L-Kanal-Niedrigbereichsignale 320i ist. Ähnlich wird
beim Schritt S202 unter Benutzung der R-Kanal-Niedrigbereichsignale 320j die
Hochbereichseitesignalenergie EI2 des R-Kanals gefunden, so dass
die Signalenergie EI2 im richtigen Verhältnis zur Energie der R-Kanal-Niedrigbereichsignale 320j ist.
-
Dann
wird beim Schritt S203 die Summe SI aus der Hochbereichseitesignalenergie
EI1 für
den L-Kanal und der Hochbereichseitesignalenergie EI2 für den R-Kanal
gefunden. Beim Schritt S204 wird eine Quadratwurzel aus dem Quotienten
aus E1 durch die Summe SI als die Gewichtungsparameter r1 für den ersten
Kanal (L-Kanal) adoptiert. Ähnlich wird
eine Quadratwurzel des Quotienten aus der Signalenergie EI2 durch
die Summe SI als Gewichtungsparameter r2 für den zweiten Kanal (R-Kanal)
adoptiert. Wie aus der Relation zwischen den Gewichtungsparametern
r1 und r2 leicht zu erkennen ist kann der Gewichtungsparameter r2
aus der Gleichung des Schritts S205 gefunden werden.
-
Bei
dem obigen Beispiel werden die Hochbereichseitesignale für den L-
und R-Kanal gemeinsam benutzt.
Jedoch können
in der Codekette auch Pegelsteuerungsdaten für den L- und R-Kanal wie beispielsweise
Gewichtungsparameter inkludiert sein. Dies verursacht ein echteres
Stereotongefühl.
Das Niedrigbereichsignal kann auch nach einer Transformation in
den (L+R)-Kanal und (L-R)-Kanal codiert werden, statt dass es als
L- und R-Kanal codiert wird. Indem dies so ausgeführt wird,
wird das (L-R)-Kanal-Signal
im Pegel erniedrigt, um eine effizientere Codierung zu realisieren,
insbesondere wenn dieses eine starke Korrelation zwischen dem L-
und R-Kanal ist.
-
32 zeigt
einen illustrativen Aufbau einer Modifikation der Codierungseinrichtung,
welche die oben erwähnten
zwei Verfahren aufweist.
-
Bei 32 werden
ein L-Kanal-Signal 330a und ein R-Kanal-Signal 330b jeweiligen
Bandteilungsfiltern 331a bzw. 331b zugeführt. Das
Bandteilungsfilter 331a teilt das L-Kanal-Signal 330a in
ein Niedrigbereich- und Hochbereichsignal, während das Bandteilungsfilter 331b das
R-Kanal-Signal 330b in ein Niedrigbereich- und Hochbereichsignal
teilt.
-
Die
vom Bandteilungsfilter 331a geteilten L-Kanal-Niedrigbereichsignale 330d und
die vom Bandteilungsfilter 331b geteilten R-Kanal-Niedrigbereichsignale 330f werden
beide zur Kanalumsetzungsschaltung 331d gesendet.
-
Die
Kanalumsetzungsschaltung 331d setzt die L-Kanal-Niedrigbereichsignale 330d und
die R-Kanal-Niedrigbereichsignale 330f in ein (L+R)-Kanal-Niedrigbereichsignal 330h und
ein (L-R)-Kanal-Niedrigbereichsignal 330i um.
-
Das
(L+R)-Kanal-Niedrigbereichsignal 330h wird zu einer Vorwärtsorthogonaltransformationsschaltung 331f gesendet,
während
das (L-R)-Kanal-Niedrigbereichsignal 330i zu
einer Vorwärtsorthogonaltranformationsschaltung 331g gesendet wird.
-
Die
von den Bandteilungsfiltern 331a, 331b geteilten
Hochbereichsignale 330c, 330e des L- und R-Kanals
werden beide zur Kanalsyntheseschaltung 331c gesendet,
um durch die Kanalsyntheseschaltung 331c in die (L+R)-Kanal-Hochbereichsignale 330g synthetisiert
zu werden, bevor sie zu einer Vortwärtsorthogonaltransformationsschaltung 331e gesendet
werden.
-
Die
oben erwähnten
Vortwärtsorthogonaltransformationsschaltungen 331e, 331f und 331g verarbeiten
die Eingangssignale mit einer Vortwärtsorthogonaltransformation,
um Signalkomponenten 330j, 330k, 330l zu
erzeugen, die zu zugeordneten Signalkomponentencodierungsschaltungen 331i, 331j bzw. 331k gesendet
werden.
-
Die
Signalkomponenten 330j, 330k, 330l aus
den Vortwärtsorthogonaltransformationsschaltungen 331e, 331f, 331g werden
auch zu einer Steuerungsschaltung 331h gesendet. Die Steuerungsschaltung 331h bestimmt
die zugeteilte Anzahl 330m von Bits zur Codierung für die Hochbereichsignalkomponenten 330j für den (L+R)-Kanal,
die zugeteilte Anzahl 330n von Bits zur Codierung für die Niedrigbereichsignalkomponenten 330k für den (L+R)-Kanal und die zugeteilte
Anzahl 330o von Bits zur Codierung für die Niedrigbereichsignalkomponenten 330l für den (L-R)-Kanal.
-
Infolgedessen
codieren die oben erwähnten Signalkomponentencodierungsschaltungen 331i, 331j und 331k die
Hochbereichsseitesignalkomponenten 330j des (L+R)-Kanals,
die Niedrigbereichsignalkomponenten 330k des (L+R)-Kanals
und die Niedrigbereichsignalkomponenten 330l des (L-R)-Kanals
auf Basis der durch die Steuerungsschaltung 331h bestimmten
Anzahlen 330m, 330n und 330o von zugeteilten
Bits.
-
Die
von den Bandteilungsfiltern 331a, 331b geteilten
Hochbereichsseitesignale 330c und 330e des L-
und R-Kanals werden auch zur Gewichtungsschaltung 331m gesendet,
die dann Gewichtungskoeffizienten (Gewichtungsparameter) 330s für den L- und R-Kanal durch
ein Verfahren setzt, das nachfolgend erläutert wird.
-
Unter
Benutzung der Codes 330b, 330q und 330r aus
den Signalkomponentencodierungsschaltungen 331i, 331j und 331k und
den Gewichtungskoeffizienten 330s aus der Gewichtungsentscheidungsschaltung 331m erzeugt
die Codekettenerzeugungsschaltung 331l eine Codekette 331t und
gibt sie aus.
-
Das
Codierungsverfahren für
den (L+R)-Kanal kann von dem für
den (L-R)-Kanal
differieren. Beispielsweise kann das Codierungsverfahren für den (L+R)-Kanal
eine feste Codelänge
benutzen, um eine Codierung und Decodierung mit einem kleineren
Verarbeitungsvolumen möglich
zu machen, oder das Codierungsverfahren für den (L-R)-Kanal kann eine Variabellängencodierung
benutzen, um das Verarbeitungsvolumen für die Codierung und Decodierung auf
Kosten einer Erhöhung
des Verarbeitungsvolumens zur Codierung und Decodierung zu reduzieren. Dies
ermöglicht,
eine Codekette so zu konstruieren, dass eine Wiedergabe durch einen
vereinfachten Hardwareaufbau möglich
ist, wenn eine monoaurale Wiedergabe ausreicht, und so, dass eine
Stereowiedergabe auch möglich
ist. Als ein Codierungsverfahren mit einer höheren Codierungseffizienz kann
nicht nur die Variabellängencodierung,
sondern auch ein Codierungsverfahren zur separaten Codierung tonaler
Komponenten, die ein konzentrierte Signalenergie aufweisen, benutzt
werden. Es ist auch möglich,
eine orthogonale Transformation zu benutzen, die für den (L+R)-
und (L-R)-Kanal unterschiedliche Transformationsblocklängen aufweist.
-
33 zeigt
ein Verarbeitungsbeispiel eines Verfahrens, bei dem die Gewichtungsentscheidungsschaltung 331m die
Gewichtungskoeffizienten 330s (Parameter R1 in 33)
bestimmt.
-
Bei 33 wird
beim Schritt S301 eine Signalenergie Eh1 der L-Kanal-Hochbereichsignale 330c gefunden
und wird beim Schritt S302 die Signalenergie Eh2 der R-Kanal-Hochbereichsignale 330e gefunden.
-
Dann
wird beim Schritt S303 die Summe Sh der Hochbereichseitesignalenergie
Eh1 für
den L-Kanal und die Hochbereichseitesignalenergie Eh2 für den R-Kanal
gefunden. Beim Schritt S304 wird eine Quadratwurzel R1 des Quotienten
aus der Signalenergie Eh1 oder Eh2 durch die Summe Sh gefunden. Dieser
Wert von R1 wird als der oben erwähnte Gewichtungsparameter zur
Codekettenerzeugungsschaltung 331l gesendet, wo er als
Teil der Codekette codiert wird.
-
34 zeigt
ein Beispiel einer durch die Codekettenerzeugungsschaltung 331l von 32 erzeugten
Codekette.
-
Nach 34 ist
die Codekette aus einem Header, der aus Synchronisationssignalen,
einer Anzahl von Niedrigbereichcodierungseinheiten und den oben
erwähnten
Gewichtungsparametern R1 zusammengesetzt ist, niedrigbereichseitecodierten
Daten des ersten Kanals ((L+R)-Kanal) (Quantisierungsfeinheitsinformation,
Normierungskoeffizienteninformation und Spektralkoeffizientendaten),
niedrigbereichseitecodierten Daten des zweiten Kanals ((L-R)-Kanal)
(Quantisierungsfeinheitsinformation, Normierungskoeffizienteninformation
und Spektralkoeffizientendaten) und hochbereichseitecodierten Daten
des (L+R)-Kanals (Quantisierungsfeinheitsinformation, Normierungskoeffizienteninformation
und Spektralkoeffizientendaten) gebildet.
-
35 zeigt
einen illustrativen Aufbau einer zum Decodieren einer durch die
Codierungseinrichtung von 32 erzeugten
Codekette adaptierten Decodierungseinrichtung.
-
Nach 35 werden
die codierten Daten 340a der Codekette von 34 durch
eine Codekettenseparierungsschaltung 341a in codierte Daten des
Hochbereichseite-(L+R)-Kanals, codierte Daten des Niedrigbereichseite-(L+R)-Kanals
und codierte Daten des Niedrigbereichseite-(L-R)-Kanals separiert.
Die codierten Daten 340b des Hochbereichseite-(L+R)-Kanals
werden durch die Signalkomponentencodierungsschaltung 341b decodiert,
während
die codierten Daten 340c des Niedrigbereichseite-(L+R)-Kanals
durch die Signalkomponentendecodierungsschaltung 341c decodiert
werden und die codierten Daten 340d des Niedrigbereichseite-(L-R)-Kanals
durch die Signalkomponentendecodierungsschaltung 341d decodiert
werden.
-
Die
durch die Signalkomponentendecodierungsschaltungen 341b, 341c bzw. 341d decodierten Signalkomponenten 340e, 340f bzw. 340g des
Hochbereichseite-(L+R)-Kanals,
Niedrigbereichseite-(L+R)-Kanals und des Niedrigbereichseite(L-R)-Kanals werden zu
zugeordneten Inversorthogonaltransformationsschaltungen 341e, 341f bzw. 341g zur
inversen orthogonalen Transformation gesendet.
-
Das
Niedrigbereichsignal 340i des (L+R)-Kanals aus der Inversorthogonaltransformationsschaltung 341f und
das Niedrigbereichsignal 340j des (L-R)-Kanals aus der
Inversorthogonaltransformationsschaltung 341g werden zu
einer Kanalumsetzungsschaltung 341i zu einer Umsetzung
in ein L-Kanal-Niedrigbereichsignal 340m und
R-Kanal-Niedrigbereichsignal 340n gesendet. Diese L-Kanal-Niedrigbereichsignale 340m und
die R-Kanal-Niedrigbereichsignale 340n werden zu zugeordneten
Bandsynthesefiltern 341l bzw. 341m gesendet.
-
Das
Hochbereichsignal 340h des (L+R)-Kanals aus der Inversorthogonaltransformationsschaltung 341e wird
zu den Gewichtungsschaltungen 341j, 341k gesendet.
-
Der
Gewichtungsschaltung 341j werden die durch die Codekettenseparierungsschaltung 341a von
der Codekette separierten Gewichtungskoeffizienten 240k (Gewichtungsparameter
R1) zugeführt. Der
Gewichtungsschaltung 341k werden die durch die Gewichtungskoeffizientenberechnungsschaltung 341h aus
den Gewichtungskoeffizienten 340k berechneten Gewichtungskoeffizienten 340l (Gewichtungsparameter
R2) zugeführt.
Die Gewichtungskoeffizienten 340k (Gewichtungsparameter
R1) und der Gewichtungskoeffizient 340l (Gewichtungsparameter
R2) sind in einer zu der Relation zwischen den Gewichtungsparameter
R1 und R2 von 31 ähnlichen Weise miteinander
korreliert und stellen Gewichtungskoeffizienten (Gewichtungsparameter)
für den
Hochbereichseite-L- und -R-Kanal dar. Das heißt in der Decodierungsschaltung
von 35 wird eine Gewichtung zum Korrigieren der Abtastwerte
der jeweiligen Signale so gemacht, dass die Abtastwerte im richtigen
Verhältnis
zu den Gewichtungskoeffizienten (Gewichtungsparameter R1 und R2)
sind, die dem L- bzw. R-Kanal zugeordnet sind.
-
Das
mit den durch die Gewichtungsschaltung 341j gewichteten
(L+R)-Hochbereichsignalen 340h korrespondierende
(L+R)-Kanal-Hochbereichsignal 340o wird zu der Bandsyntheseschaltung 341l gesendet,
der von der Kanalumsetzungsschaltung 341i die L-Kanal-Niedrigbereichsignale 340m zugeführt werden.
Das mit den durch die Gewichtungsschaltung 341k gewichteten
(L+R)-Hochbereichsignalen 340h korrespondierende
(L+R)-Kanal-Hochbereichsignal 340p wird zur Bandsyntheseschaltung 341m gesendet,
der die R-Kanal-Niedrigbereichsignale 340n von
der Kanalumsetzungsschaltung 341i zugeführt werden.
-
Das
Bandsynthesefilter 341l synthetisiert die für den L-Kanal
gewichteten (L+R)-Hochbereichsignale 340o und die L-Kanal-Niedrigbereichsignale 340m mittels
einer Synthetisierung des niedrigen und hohen Bereichs, um ein durch
die Synthese erhaltenes L-Kanal-Zeitbereichsignal 340q des
ganzen Bereichs auszugeben. Das Bandpasssynthesefilter 341m synthetisiert
die für
den R-Kanal gewichteten (L+R)-Hochbereichsignale 340p und
die R-Kanal-Niedrigbereichsignale 340n mittels einer Synthetisierung
des niedrigen und hohen Bereichs, um ein durch die Synthese erhaltenes
R-Kanal-Zeitbereichsignal 340r des ganzen Bereichs auszugeben.
-
36 zeigt
ein Verarbeitungsbeispiel zur Berechnung der Gewichtungskoeffizienten 340l (Gewichtungsparameter
R2) durch die Gewichtungskoeffizientenberechnungsschaltung 341h von 35.
-
Bei 36 wird
beim Schritt S401 ein quadrierter Wert von R1 von 1 subtrahiert
und eine Quadratwurzel der resultierenden Differenz als R2 gefunden.
Indessen ist R1 der mit dem Gewichtungskoeffizienten 340k korrespondierende
Gewichtungsparameter. Der Wert von R2 wird zum oben erwähnten Bandsynthesefilter 341m als
der oben erwähnte
Gewichtungskoeffizient 340p gesendet.
-
Bei
dem anhand der 32 und 35 erläuterten
illustrativen Verfahren kann die Hochbereichseitesignalverteilung
durch Anwendung der Hochbereichsseiteenergieproportion selbst bestimmt werden,
indem die wie oben beschrieben erhaltenen Gewichtungsparameter R1
und R2 angewendet und eine kleineren Anzahl von Bits wird, was eine
Wiedergabe des echten Stereotongefühls durch die originalen Akustiksignale
ermöglicht.
-
Es
ist die Tatsache bemerkenswert, dass mit der Vorwärtsorthogonaltransformationsschaltung
der Codierungseinrichtung und der inversen orthogonalen Transformation
der Decodierungsschaltung der L- und R-Kanal für die Hochbereichseiten gemeinsam
benutzt werden können,
wodurch im Vergleich zum oben beschriebenen Verfahren eine Ersparung beim
Verarbeitungsvolumen und beim Pufferspeicherraum realisiert wird.
-
Die
obige Beschreibung ist für
den Fall einer Benutzung eines Teilungsfilters zur Teilung des Frequenzspektrums
in einen Hoch- und Niedrigfrequenzbereich gemacht worden. Die vorliegende
Erfindung kann jedoch bei einem Fall angewendet werden, bei dem
die Anzahl von Teilungen des Frequenzspektrums größer als
zwei ist.
-
Die 37 und 38 zeigen
einen illustrativen Aufbau einer Codierungseinrichtung (37 und
einer Decodierungseinrichtung (38), wenn das
Verfahren der vorliegenden Erfindung auf den Fall angewendet wird,
bei dem die Anzahl einer Teilung des Frequenzspektrums gleich 4
ist. Wie anhand von 8 erläutert wird die mit einer Normierung
verarbeitete Codierungseinheit durch das Bandteilungsfilter unabhängig von
der Bandteilungsbreite eingestellt. Es sei darauf hingewiesen, dass
im Unterschied zum oben beschriebenen Verfahren einer Variierung der
Pegel des L- und R-Kanals von einer Codierungseinheit zu einer anderen
die Vorwärtsorthogonaltransformation
für die
Hochbereichseite und die inverse orthogonale Transformation für die Hochbereichseite
als für
die zwei Kanäle
gemeinsam verarbeitet sein kann, wodurch wiederum im Verarbeitungsvolumen
und im Pufferspeicherraum eine Ersparnis realisiert wird.
-
Bei
der in 37 gezeigten Codierungseinrichtung
wird zu den Bandteilungsfiltern 351a und 351b das
jeweilige L-Kanal-Signal 350a bzw. R-Kanal-Signal 350b gesendet.
Das Bandteilungsfilter 351a teilt das L-Kanal-Signal 350a in
vier Bandsignale 350c1, 350c2, 350c3 und 350d.
Das Bandteilungsfilter 351b teilt ähnlich das R-Kanal-Signal 350b in vier
Bandsignale 350e1, 350e2, 350e3 und 350f.
-
Das
durch das Bandteilungsfilter 351a geteilte L-Kanal-Niedrigstsignal 350d und
das vom Bandteilungsfilter 351b geteilte R-Kanal-Niedrigstsignal 350f werden
beide zur Kanalumsetzungsschaltung 351c gesendet.
-
Die
Kanalumsetzungsschaltung 351c setzt das L-Kanal-Niedrigstsignal 350d und
das R-Kanal-Niedrigstsignal 350f in das (L+R)-Kanal-Niedrigstsignal 350a und
das (L-R)-Kanal-Niedrigstignal 350i um.
-
Das
(L+R)-Kanal-Niedrigstsignal 350h und das (L-R)-Kanal-Niedrigstsignal 350i werden
zu Vorwärtsorthogonaltransformationsschaltungen 351d bzw. 351e gesendet.
Die Signalkomponenten 350j, 350k aus diesen jeweiligen
Vorwärtsorthogonaltransformationsschaltungen 351d bzw. 351e werden
zu jeweils zugeordneten Signalkomponentencodierungsschaltungen 351k bzw. 351l gesendet.
-
Die
durch die Bandteilungsfilter 351a und 351b geteilten
drei verbleibenden Hochbereichseitesignale 350c1, 350c2, 350c3 und 350e1, 350e2, 350e3 des
L- und R-Kanals
werden zu Kanalsyntheseschaltungen 351f1, 351f2 und 351f3 gesendet,
die in Zuordnung zu den jeweiligen Bändern vorhanden sind. Die Kanalsyntheseschaltung 351f1 synthetisiert die
Oberstbereichseitesignale 350c1, 350e1 des L- und
R-Kanals, um das (L+R)-Kanal-Oberstsignal 350g1 zu erzeugen.
Die Kanalsyntheseschaltung 351f2 synthetisiert die Zweitoberstbereichseitesignale 350c2, 350e2 des
L- und R-Kanals,
um das (L+R)-Kanal-Zweitoberstsignal 350g2 zu erzeugen. Die
Kanalsyntheseschaltung 351f synthetisiert die Drittoberstbereichseitesignale 350c3, 350e3 des
L- und R-Kanals, um das (L+R)-Kanal-Drittoberstsignal 350g3 zu
erzeugen.
-
Die
Hochbereichsignale 350g1, 350g2 und 350g3 aus
den Kanalsyntheseschaltungen 351f1, 350f2 und 350f3 werden
zu Vorwärtsorthogonaltransformationsschaltungen 351g1, 351g2 und 351g3 zu
einer Vorwärtsorthogonaltransformation gesendet.
Die bei der Vorwärtsorthogonaltransformation
durch die Vorwärtsorthogonaltransformationsschaltungen 351g1, 351g2 bzw. 351g3 erhaltenen jeweiligen
Signalkomponenten 350m1, 350m2 und 350m3 werden
zur Signalkomponentencodierungsschaltung 351j gesendet.
-
Die
Signalkomponenten 350j, 350k, 350m1, 350m2 und 350m3 aus
den Vorwärtsorthogonaltransformationsschaltungen 351d, 351e, 351g1, 351g2 und 351g3 werden
zu einer Steuerungsschaltung 351i gesendet. Die Steuerungsschaltung 351i bestimmt
die zugeteilten Anzahlen 350n von Bits zur Codierung für die Hochbereichseitesignalkomponenten 350m1, 350m2 und 350m3 des
(L+R)-Kanals, die zugeteilten Anzahlen 350o von Bits für die (L+R)-Kanal-Niedrigstsignalkomponenten 350j und die
zugeteilten Anzahlen 350p von Bits zur Codierung für die (L-R)-Kanal-Niedrigstsignalkomponenten 350k.
-
Infolgedessen
codieren die Signalkomponentencodierungsschaltungen 351j, 351k und 3511 die
Hochbereichseitesignalkomponenten 350m1, 350m2 und 350m3 des
(L+R)-Kanals, Niedrigstsignalkomponenten 350j des (L+R)-Kanals
und die Niedrigstsignalkomponenten 350k des (L-R)-Kanals auf
der Basis der Anzahlen 350n, 350o und 350p von zugeteilten
Bits, wie sie durch die Steuerungsschaltung 351i bestimmt
werden.
-
Die
vier Hochbereichseite-Dreiband-Signale 350c1, 350c2, 350c3, 350e1, 350e2 und 350e3,
die bei der Teilung durch die Bandteilungsfilter 351a, 351b in
vier erhalten werden, werden auch zu einer Gewichtungsentscheidungsschaltung 351h gesendet,
die dann die Gewichtungskoeffizienten (Gewichtungsparameter) 350l für den L-
und R-Kanal durch das wie oben beschriebene Verfahren bestimmt.
-
Die
Codekettenerzeugungsschaltung 351l erzeugt unter Benutzung
von Codes 350q, 350r und 350s aus den
Signalkomponentencodierungsschaltungen 351j, 351k und 351l und
den Gewichtungskoeffizienten 350l aus der Gewichtungsentscheidungsschaltung 351h eine
Codekette 350t und gibt sie aus.
-
Die
in 38 gezeigte Decodierungseinrichtung teilt die
codierten Daten 360a der durch die Codierungseinrichtung
von 37 erzeugten Codekette in codierte Daten von drei
Obereseitebändern
des (L+R)-Kanals, (L+R)-Kanals der Niedrigstbereichsseite und des
(L-R)-Kanals der Niedrigstbereichsseite durch die Codekettenteilungsschaltung 361a.
Die codierten Daten von drei Obereseitebändern des (L+R)-Kanals 360h1, 360h2 und 360h3 werden durch
zugeordnete Signalkomponentendecodierungsschaltungen 361g1, 361g2 und 361g3 decodiert.
Die codierten Daten 360b des (L+R)-Kanals der Niedrigstbereichsseite
werden durch die Signalkomponentendecodierungsschaltung 361b decodiert, während die
codierten Daten 360c des (L-R)-Kanals der Niedrigstbereichsseite
durch die Signalkomponentendecodierungsschaltung 361c decodiert
werden.
-
Die
Signalkomponenten 360i1, 360i2, 360i3, 360d und 360e des
Hochbereichsseite-Dreiband-(L+R)-Kanals, des Niedrigstseite-(L+R)-Kanals
und des Niedrigstseite-(L-R)-Kanals werden zu zugeordneten Inversorthogonaltransformationsschaltungen 361h1, 361h2, 361h3, 361d und 361e zu
einer inversen orthogonalen Transformation gesendet.
-
Das
Niedrigstbereich-(L+R)-Kanal-Signal 360f aus der Inversorthogonaltransformationsschaltung 361d und
das Niedrigstbereichs-(L-R)-Kanal-Signal 360g aus
der Inversorthogonaltransformationsschaltung 361e werden
zur Kanalumsetzungsschaltung 361f zur Umsetzung in das
Niedrigst-L-Kanal-Signal 360m und Niedrigst-R-Kanal-Signal 360n gesendet.
Das Niedrigst-L-Kanal-Signal 360m und das Niedrigst-R-Kanal-Signal 360n werden
zu zugeordneten jeweiligen Gewichtsschaltungen 361l bzw. 361m gesendet.
-
Andererseits
werden die Hochbereichseite-Dreiband-(L+R)-Kanal-Signale 360j1, 360j2 und 360j3 aus
den Inversorthogonaltransformationsschaltungen 361h1, 361h2 und 361h3 zu
zugeordneten Gewichtungsschaltungen 361j1, 361j2, 361j3, 361k1, 361k2 und 361k3 gesendet.
-
Den
Gewichtungsschaltungen 361j1, 361j2, 361j3 werden
von der Codekette 360k durch die Codekettenteilungsschaltung 361a separierte
Gewichtungskoeffizienten zugeführt.
Den Gewichtungsschaltungen 361k1, 361k2 und 361k3 werden
von den Gewichtungskoeffizienten 360k durch die Gewichtungskoeffizientenberechnungsschaltung 361i berechnete
Gewichtungskoeffizienten 360l zugeführt. Die Relation zwischen
den Gewichtungskoeffizienten 360k und den Gewichtungskoeffizienten 360l ist ähnlich zu
der zwischen den in 35 gezeigten Gewichtungskoeffizienten 340k, 340l.
-
Die
bei der Gewichtung der Hochbereichseite-Dreiband-(L+R)-Kanal-Signale 360j1, 360j2 und 360j3 durch
die zugeordneten Gewichtungsschaltungen 361j1, 361j2 und 361j3 erhaltenen
Hochbereichsseite-Dreiband-(L+R)-Kanal-Signale 360o1, 360o2 und 360o3 werden
zur Bandsyntheseschaltung 361l gesendet, der von der Kanalumsetzungsschaltung 361f das
Niedrigstsignal des L-Kanals 360m zugeführt wird. Andererseits werden
die von den Gewichtungsschaltungen 361k1, 361k2 und 361k3 gewichteten
Hochbereichsseite-Dreiband-(L+R)-Kanal-Signale 360p1, 360p2 und 360p3 zur
Bandsyntheseschaltung 361m gesendet, der das Niedrigstsignal
des R-Kanals 360n aus
der Kanalumsetzungsschaltung 361f zugeführt wird.
-
Das
Bandsynthesefilter 361l synthetisiert das für den L-Kanal
gewichtete Hochbereichseite-Dreiband-(L+R)-Kanal-Signal 360o1, 360o2 und 360o3 und
das Niedrigst-L-Kanal-Signal 350m mittels einer Synthetisierung
der Niedrigbereich- und Hochbereichsignale, um ein L-Kanal-Zeitbereichssignal 360k für den ganzen
Bereich auszugeben, das aus der Synthese resultiert. Andererseits
synthetisiert das Bandsynthesefilter 361m das Hochbereichsseite-Dreiband-(L+R)-Kanal-Signal 360p1, 360p2 und 360p3,
das für
den R-Kanal gewichtet wird, und das Niedrigst-R-Kanal-Signal 360n mittels einer
Synthetisierung der Niedrigstbereich- und Hochbereichsignale, um
ein aus der Synthese resultierendes R-Kanal-Zeitbereichssignal 360r auszugeben.
-
Wenn
die vorhergehende Beschreibung bezüglich der Benutzung von zwei
Kanälen
aus L und R gemacht ist, so kann die vorliegende Erfindung auf akustische
Signale von drei oder mehr Kanälen
angewendet werden. Die von der obigen Codierungseinrichtung erzeugte
Codekette, das heißt
der codierte Bitstrom, kann auf einem Aufzeichnungsmedium wie beispielsweise
einer optischen Platte, einer Magnetplatte, einem Magnetband oder
einem Halbleiterspeicher aufgezeichnet sein oder durch eine Übertragungsleitung
wie beispielsweise eine optische Faser, elektrische Wellen oder
Infrarotstrahlen übertragen werden.
-
Wenn
die vorhergehende Beschreibung bezüglich der Benutzung einer orthogonalen
Transformation gemacht ist, so kann das Verfahren der vorliegenden
Erfindung auf den Fall einer Benutzung nur eines Bandteilungsfilters
angewendet werden.