-
Vorrichtung
und Verfahren zur Informationscodierung und zur Informationsdecodierung
sowie Informationsaufzeichnungsträger mit codierten Daten
-
Hintergrund
der Erfindung
-
Die
Erfindung bezieht sich auf eine Informationscodierungsvorrichtung
und ein Informationscodierungsverfahren, auf ein Informationsdecodierungsverfahren
und eine Informationsdecodierungsvorrichtung sowie auf einen Informationsaufzeichnungsträger bzw.
-medium, und sie bezieht sich insbesondere auf eine Informationscodierungsvorrichtung
und ein Informationscodierungsverfahren, auf ein Informationsdecodierungsverfahren
und eine Informationsdecodierungsvorrichtung sowie auf einen Informationsaufzeichnungsträger bzw.
-medium, die geeignet sind für
die Verwendung zum Codieren von eingangsseitigen Digitaldaten durch
eine einen hohen Wirkungsgrad aufweisende Codierung und zur Übertragung,
Aufzeichnung, Wiedergabe und Decodierung der codierten Digitaldaten,
um ein Wiedergabesignal zu erhalten.
-
Variable
Verfahren zur Codierung eines Audio- oder Sprachsignals mit hohem
Wirkungsgrad sind verfügbar
und umfassen beispielsweise eine Subbandcodierung (SBC), bei der
es sich um ein ohne Blockbildung arbeitendes Frequenzband-Unterteilungsverfahren
handelt, gemäß dem ein
Audiosignal oder dergleichen Signal auf der Zeitbasis nicht zu Blöcken gebildet
wird, sondern in eine Vielzahl von Frequenzbändern unterteilt und codiert
wird, und eine Transformationscodierung, bei der es sich um ein
Blockbildungs-Frequenzband-Unterteilungsverfahren handelt, gemäß dem ein
Signal auf der Zeitbasis in ein anderes Signal auf der Frequenzbasis transformiert
(im Spektrum transformiert) und in eine Vielzahl von Frequenzbändern un terteilt
und sodann bezüglich
jedes Frequenzbandes codiert wird.
-
Außerdem ist
ein Verfahren zur Hochfrequenzcodierung verfügbar, das eine Kombination aus
der Subbandcodierung und der oben beschriebenen Transformationscodierung
umfasst. Bei diesem Verfahren wird beispielsweise zuerst eine Bandunterteilung
durch eine Subbandcodierung ausgeführt, und sodann werden die
Signale im jeweiligen Band in Signale auf der Zeitbasis im Spektrum
transformiert, woraufhin eine Codierung bezüglich der im Spektrum transformierten
Signale für
das jeweilige Band ausgeführt
wird. Dabei kann beispielsweise ein Quadratur-Spiegelfilter als
Filter für
die oben erwähnte
Bandaufteilung verwendet werden. Das Quadratur-Spiegelfilter ist
beispielsweise angegeben von R. E. Crochiere in "Digital coding of speech in subbands", Bell Syst. Tech.
J., Vol. 55, No. 8, 1976.
-
Unterdessen
ist ein Filteraufteilungsverfahren zur Aufteilung in gleiche Bandbreiten
angegeben von Joseph H. Rothweiler in "Polyphase Quadrature filters – A new
subband coding technique",
ICASSP 83, BOSTON. Hier steht als die oben erwähnte Spektrums-Transformation
eine Spektrums-Transformation zur Verfügung, bei der beispielsweise
ein eingangsseitiges Audiosignal mit einer bestimmten Einheitszeit
(Rahmen) zu Blöcken
gebildet wird und bei der eine diskrete Fouriertransformation (DFT),
eine diskrete Cosinustransformation (DCT) oder eine modifizierte
diskrete Cosinustransformation (MDCT) für jeden Block ausgeführt wird,
um das Signal der Zeitbasis in ein anderes Signal der Frequenzbasis
zu transformieren. Die MDCT-Transformation
ist beispielsweise angegeben von J.P. Princen und A.B. Bradley in "Subband/Transform
Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation", Univ. des Surrey
Royal Melbourne Inst. of Tech., ICASSP, 1987.
-
Durch
auf diese Weise mittels einer Filter- oder Spektrums-Transformation auf
einzelne Bänder aufgeteilte
Quantisierungssignale kann ein Band, in welchem Quantisierungsrauschen
hervorgerufen ist, gesteuert werden, und eine Codierung mit einem
höheren
Wirkungsgrad hinsichtlich der Hörbarkeit
kann dadurch erreicht werden, dass von einer Eigenschaft eines Maskierungseffekts
oder eines ähnlichen
Effekts Gebrauch gemacht wird. Falls eine Normierung bezüglich jedes
Bandes vorgenommen wird, kann hier vor der Ausführung der Quantisierung mit
einem Maximalwert aus Absolutwerten von Signalkomponenten in dem
Band eine Codierung mit einem weit höheren Wirkungsgrad erwartet
werden.
-
Als
Frequenzaufteilungsbreite zur Quantisierung der frequenzbandmäßig aufgeteilten
Frequenzkomponenten wird eine Bandaufteilung ausgeführt, gemäß der beispielsweise
die Gehörsinncharakteristik
eines Menschen berücksichtigt
wird. So wird insbesondere ein Audiosignal in der Frequenz in eine Vielzahl
von Bändern
(beispielsweise in 25 Bänder) aufgeteilt,
deren Bandbreite mit zunehmender Frequenz bis zu einem hohen Frequenzband
zunimmt, das normalerweise als kritisches Band bezeichnet wird.
Auf eine in diesem Fall in jedem Band erfolgende Datencodierung
hin wird ferner eine Codierung mit einer bestimmten Bitzuweisung
für die
einzelnen Bänder
oder mit einer adaptiven Bitzuweisung für die einzelnen Bänder ausgeführt.
-
Auf
eine Codierung von Koeffizientendaten hin, die mittels der oben
erwähnten
MDCT-Verarbeitung durch die Bitzuweisung erhalten werden, werden
die MDCT-Koeffizientendaten in jedem Band, die durch die MDCT-Verarbeitung
für jeden
der oben erwähnten
Blöcke
erhalten werden, mit einer adaptiven Zuweisungsbitzahl codiert.
Die folgenden beiden Verfahren sind für die Bitzuweisung bekannt.
-
Das
erste Verfahren ist angegeben von R. Zelinski und P. Noll in "Adaptive Transform
Coding of Speech Signals",
IEEE Tran sactions of Acoustics, Speech, and Signal processing, Vol.
ASSP-25, No. 4, August 1977. Hier erfolgt eine Bitzuweisung auf
der Grundlage der Größe eines
Signals für
das jeweilige Band. Mit dem Verfahren werden flache Quantisierungsrauschspektren
erhalten, und die Rauschenergie ist minimiert. Da der Maskierungseffekt
auf den Gehörsinn
nicht genutzt wird, ist indessen der tatsächliche Rauscheindruck nicht
optimal.
-
Das
zweite Verfahren ist angegeben von M. A. Kransner in "The critical band
order-digital encoding of the perceptual requirements of the auditory system", ICASSP, MIT, 1980.
Das Dokument rezitiert ein Verfahren, bei dem eine Gehörsinnmaskierung dazu
herangezogen wird, einen geforderten Rauschabstand für jedes
Band zu erzielen, um eine feste Bitzuweisung vorzunehmen. Bei dem
Verfahren zeigt jedoch sogar dann, wenn eine Charakteristik mittels eines
Sinuswellen-Eingangssignals gemessen wird, der Charakteristikwert
wegen der festliegenden Bitzuweisung keinen sehr guten Wert.
-
Um
solche Probleme zu lösen,
ist eine hocheffiziente Codierungsvorrichtung vorgeschlagen worden,
bei der sämtliche
Bits, die für
eine Bitzuweisung verwendet werden können, aufteilungsmäßig als
Bits für
ein festes Bitzuweisungsmuster verwendet werden, welches im Voraus
für jeden
Subblock festgelegt wird, und bei der Bits, die für eine Bitzuweisung
herangezogen werden, welche sich auf die Größe eines Signals des jeweiligen
Blocks stützt,
und das Aufteilungsverhältnis
zwischen ihnen auf der Grundlage eines Signals festgelegt ist, welches
sich auf ein Eingangssignal bezieht, so dass das Aufteilungsverhältnis bezüglich des
festen Bitzuweisungsmusters zunimmt, wenn die Spektren der oben
erwähnten
Signale gleichmäßiger werden.
-
Wenn
bei der oben beschriebenen Vorrichtung Energie in einem bestimmten
Spektrum konzentriert ist, wie in dem Fall, dass eine Sinuswelle
eingegeben wird, wird eine vergleichsweise große Zahl von Bits dem Block
zugewiesen, der das Spektrum enthält, wodurch die Gesamt-Störabstandscharakteristik
merklich verbessert werden kann. Da der Gehörsinn des Menschen für ein Signal
sehr empfindlich ist, welches eine steile Spektrumskomponente aufweist,
verbessert eine Verbesserung in der Störabstandscharakteristik durch
Anwendung eines derartigen Verfahrens, wie es oben beschrieben ist,
generell nicht nur den Wert bei der Messung, sondern sie ist auch
hinsichtlich der Verbesserung in der Tonqualität auf den Gehörsinn wirksam.
-
Für die Bitzuweisung
sind viele weitere verschiedene Verfahren vorgeschlagen worden,
und das Modell bezüglich
des Gehörsinns
ist feiner ausgebildet worden. Falls eine Codierungsvorrichtung hinsichtlich
der Fähigkeit
verbessert ist, dann wird eine Codierung mit einem höheren Wirkungsgrad hinsichtlich
des Gehörsinns
erreicht.
-
Die
Erfinder der vorliegenden Erfindung haben in der PCT-Anmeldung PCT/JP94/00880,
eingereicht am 31. Mai 1994 und in einer entsprechenden US-Patentanmeldung,
Serial-No. 08/374,518 ein Verfahren vorgeschlagen, gemäß dem eine
Tonkomponente, die hinsichtlich des Gehörsinns besonders wichtig ist,
aus einem Spektrumssignal abgetrennt und gesondert von anderen Spektrumskomponenten codiert
wird. Durch dieses Verfahren kann ein Adiosignal oder ein ähnliches
bzw. dergleichen Signal bei einem hohen Kompressionsverhältnis effizient
codiert werden, während
hinsichtlich des Gehörsinns eine
geringe Verschlechterung bewirkt wird.
-
In
dem Fall, dass die oben erwähnten
DFT- oder DCT-Transformationen als Verfahren zum Transformieren
eines Wellenformsignals in ein Spektrum herangezogen werden, werden
M unabhängige Echtzahldaten
durch die Transformation mit einem Zeitblock erhalten, der M Abtastproben
enthält.
Um die Verbindungsverzerrung zwischen Zeitblöcken zu verringern, sind üblicherweise
M1 Abtastproben zwischen zwei benachbarten Blöcken einander überlappt,
und infolgedessen werden entspre chend der DFT- oder DCT-Transformation
auf eine Mittelung hin M Echtzahldaten für (M-M1)-Abtastproben quantisiert
und codiert.
-
In
dem Fall, dass andererseits die oben erwähnte MDCT-Transformation als
Verfahren zum Transformieren eines Wellenformsignals in ein Spektrum
verwendet wird, werden M unabhängige
Echtzahldaten von 2M Abtastproben erhalten, von denen N Abtastproben
mit solchen jedes der gegenüberliegend
benachbarten Zeitpunkten überlappt
sind. Infolgedessen werden gemäß der MDCT-Transformation, wenn
eine Mittelung erfolgt, M Echtzahldaten für M Abtastproben quantisiert
und codiert. In einer Decodierungsvorrichtung wird eine inverse
Transformation bezüglich
jedes Blocks aus Codes ausgeführt,
die unter Heranziehung der MDCT-Transformation auf diese Art und
Weise erhalten sind, und die durch die inverse Transformation erhaltenen
Wellenformelemente werden in einer sich überlagernden Beziehung zueinander
addiert, um ein Wellenformsignal zurückzugewinnen.
-
Durch
Vergrößern der
Länge eines
Zeitblocks zur Transformation wird generell die Frequenzauflösung von
Spektren zunehmen, und die Energie wird auf eine bestimmte Spektrumskomponente
konzentriert. Demgemäß kann in
dem Fall, dass die MDCT-Transformation angewandt wird, bei der ein langer
Block so transformiert wird, dass einzelne Hälften des betreffenden Blocks
sich mit Blöcken
auf den gegenüberliegenden
Seiten überlappen,
und bei dem die Anzahl der Spektrumssignale, die erhalten werden,
nicht eine Zunahme in der Anzahl bezüglich der ursprünglichen
Anzahl von Zeit-Abtastproben zeigt, eine Codierung mit einem höheren Wirkungsgrad
ausgeführt
werden als in dem Fall, dass die DFT- oder DCT-Transformation angewandt
wird. Durch Bereitstellen einer hinreichend großen Überlappungslänge zwischen
benachbarten Blöcken kann
ferner die Zwischenblock-Verzerrung eines Wellenformsignals verringert
werden.
-
Um
eine tatsächliche
Codefolge zu bilden, sollten die Quantisierungsgenauigkeitsinformation und
die Normierungskoeffizienteninformation mit einer bestimmten Bitzahl
für jedes
Band codiert werden, bezüglich
dessen eine Quantisierung und Normierung ausgeführt werden, und sodann sollte
das normierte und quantisierte Spektrumssignal codiert werden.
-
Als
Verfahren zum Codieren eines Spektrumssignals ist beispielsweise
ein Verfahren bekannt, welches eine Codierung mit variabler Länge nutzt,
wie die Huffman-Codierung. Die Huffman-Codierung ist beispielsweise
angegeben von David A. Huffman in "A Method for the Construction of Minimum-Redundancy
Codes", Proceedings
of the I.R.E., Sep. 1952, Seiten 1098–1101.
-
Außerdem ist
ein weiteres Verfahren bekannt, welches einen mehrdimensionalen
variablen Längencode
nutzt, durch den eine Vielzahl von Spektrumssignalen kollektiv durch
einen einzelnen Code dargestellt wird. Generell nimmt bei einem
Codierungsverfahren, welches einen mehrdimensionalen variablen Längencode
anwendet, der Wirkungsgrad bei der Codierung hinsichtlich des Kompressionswirkungsgrades
zu, wenn die Folgezahl des Codes zunimmt. Da der Umfang einer Codefolgentabelle
progressiv zunimmt, wenn die Folgezahl steigt, führt das Verfahren im praktischen
Gebrauch jedoch zu einem Problem. Tatsächlich wird eine optimale Folgezahl
in Übereinstimmung
mit einem Objekt ausgewählt,
und zwar unter Berücksichtigung
des Kompressionswirkungsgrades und des Umfangs der Codefolgentabelle.
-
Generell
ist in einem akustischen Wellenformsignal die Energie häufig auf
eine Grundfrequenzkomponente und auf Frequenzkomponenten konzentriert,
die ganzzahlige Vielfache der Grundfrequenz sind, das sind Oberschwingungen
bzw. harmonische Komponenten; da die Spektrumssignale um die Frequenzen
herum sehr niedrige Pegel im Vergleich zu jenen der harmonischen
Komponenten aufweisen, werden sie mit einer vergleichs weise hohen
Wahrscheinlichkeit mit bzw. zu 0 quantisiert. Um solche Signale,
wie oben beschrieben, effizient zu codieren, sollten Spektrumssignale,
die zu 0 quantisiert werden, was mit einer hohen Wahrscheinlichkeit geschieht,
mit einer möglichst
geringen Informationsmenge codiert werden. In dem Fall, dass eindimensionale
variable Längencodes
verwendet werden, ist sogar dann, wenn jedes Spektrumssignal mit
einem Bit codiert wird, welches die kleinste Codelänge darstellt,
eine N-Bit-Information für
N Spektren erforderlich. In dem Fall, dass ein mehrdimensionaler
variabler Längencode
mit der Folgezahl N verwendet wird, kann mit Rücksicht darauf, dass N Spektren
mit einem Bit von der kleinsten Codelänge codiert werden können, eine
effiziente Codierung für
Signale ausgeführt
werden, die solche Frequenzkomponenten, wie oben beschrieben, aufweisen.
-
Während sich
eine Zunahme der Folgezahl der Codes bei einem Codierungsverfahren,
welches einen mehrdimensionalen variablen Längencode verwendet, hinsichtlich
des Kompressionswirkungsgrades erheblich vorteilhaft auswirkt, ist
es indessen in dem Fall, dass eine praktische Anwendung berücksichtigt
wird, unmöglich,
die Folgezahl unbegrenzt zu erhöhen.
-
Normalerweise
wird eine Codefolgentabelle für
jede Quantisierungsgenauigkeitsinformation erstellt, die für das jeweilige
Band festgelegt ist. In dem Fall, dass die Quantisierungsgenauigkeit
niedrig ist, da die Anzahl der Werte der Spektrumssignale, die dargestellt
werden können,
gering ist, wird jedoch sogar in dem Fall, dass die Folgezahl erhöht ist,
der Umfang der Codefolgentabelle nicht so sehr erhöht. In dem
Fall, dass die Quantisierungsgenauigkeit hoch ist, ist jedoch auch
die Anzahl der Werte der Spektrumssignale, die dargestellt werden
können, ebenfalls
hoch. Daher wird sogar dann, wenn die Folgezahl lediglich um eins
erhöht
wird, der Umfang der Codefolgentabelle merklich erweitert.
-
Dies
wird unter Heranziehung eines konkreten Beispiels in weiteren Einzelheiten
beschrieben. Nunmehr sei angenommen, dass ein Eingangssignal einer
MDCT-Transformation unterzogen worden ist, um solche Spektren zu
erhalten, wie sie in 1 dargestellt sind. In 1 sind
die Absolutwerte der Spektren der MDCT-Transformation im Pegel in dB-Werte
umgesetzt und auf der Ordinatenachse aufgetragen. Auf der Abszissenachse
ist die Frequenz aufgetragen, und ein Eingangssignal wird unter
Heranziehung einer bestimmten Zeitspanne als ein Block in 32 Spektrumssignale
transformiert. Die Spektrumssignale werden in sechs codierte Einheiten
aufgeteilt, die in 1 mit [1] bis [6] bezeichnet sind
und die jeweils eine Vielzahl von Spektren enthalten; für jede codierte
Einheit werden eine Normierung und eine Quantisierung ausgeführt.
-
Durch
Verändern
der Quantisierungsgenauigkeit für
die jeweilige codierte Einheit in Abhängigkeit von einer Art der
Verteilung der Frequenzkomponenten kann eine Codierung ausgeführt werden,
die die Verschlechterung in der Tonqualität minimiert und die hinsichtlich
des Gehörsinns
effizient ist. Die für die
jeweilige codierte Einheit benötigte
Quantisierungsgenauigkeitsinformation kann durch Berechnen beispielsweise
eines minimal hörbaren
Pegels oder eines Maskierungspegels in einem Band, welches der jeweiligen
codierten Einheit entspricht, auf der Grundlage eines Gehörsinnmodells
erhalten werden. Jedes normierte und quantisierte Spektrumssignal wird
in einen Code variabler Länge
transformiert und zusammen mit der Quantisierungsgenauigkeitsinformation
und der Normierungsinformation für
die jeweilige codierte Einheit codiert.
-
Die
Tabelle A veranschaulicht ein Darstellungsverfahren, wenn eine Quantisierungsgenauigkeitsinformation übertragen
wird. In dem Fall, dass ein Quantisierungsgenauigkeits-Informationscode durch
drei Bits dargestellt ist, können
acht verschiedene Arten der Quantisierungsgenauigkeitsinformation
festgelegt werden. Bei dem dargestellten Beispiel wird die Quantisierung
mit einer der acht verschiedenen Schrittzahlen ausgeführt, nämlich mit
einem Schritt, drei Schritten, fünf
Schritten, sieben Schritten, 15 Schritten, 31 Schritten, 63 Schritten
und 127 Schritten.
-
Hier
bedeutet eine Quantisierung in einem Schritt, dass Spektrumssignale
in der codierten Einheit alle zum Wert 0 quantisiert werden.
-
2 veranschaulicht
in einer schematischen Darstellung ein Verfahren einer variablen
Längencodierung,
welches in üblicherweise
ausgeführt worden
ist. Spektrumssignale werden mit einer Quantisierungsgenauigkeitsinformation
quantisiert, die für
jede codierte Einheit festgelegt ist, um Quantisierungsspektren
zu erhalten. Die Quantisierungsspektren werden dadurch in eine entsprechende
Codefolge transformiert, dass auf eine solche Codefolgentabelle
Bezug genommen wird, wie sie als Tabelle B dargestellt ist.
-
Gemäß 2 wird
beispielsweise für
die codierte Einheit [1] ein Code 011 als Quantisierungsgenauigkeitsinformation
ausgewählt.
Demgemäß wird eine
Quantisierung mit sieben Schrittzahlen bzw. Schritten ausgeführt, wie
dies aus der Tabelle B ersichtlich ist, und die Werte der quantisierten
Spektrumssignale sind in der Reihenfolge von der Seite niedriger
Frequenz her gegeben mit –1,
3, 0, 1. Hier ist darauf hinzuweisen, dass der Pegel des jeweiligen Spektrumssignals
durch einen Absolutwert dargestellt ist.
-
Falls
die Spektrumssignale in Codefolgen unter Heranziehung des Codefolgentabellenteiles der
Tabelle B transformiert werden, in welchem der Quantisierungsgenauigkeits-Informationscode
gegeben ist mit 011, dann werden die Zifferndaten von 101, 1110,
0 bzw. 100 erhalten. Damit weisen die Daten die Codelängen von
3, 4, 1 bzw. 3 auf.
-
Unterdessen
wird für
die codierte Einheit [2] ein anderer Code 010 als Quantisierungsgenauigkeitsinformation
ausgewählt.
-
In
diesem Fall wird eine Quantisierung mit fünf verschiedenen Schrittzahlen
bzw. Schritten ausgeführt,
wie dies aus der Tabelle B ersichtlich ist. Als Codefolgen, die
hier verwendet werden können,
weisen fünf
verschiedene Zifferndaten von 111, 101, 0, 100 und 110 die geringste
Wortlänge
auf. Der Grund hierfür
liegt darin, dass dann, wenn beispielsweise Codefolgen 10, 11, 0,
01 und 101 verwendet werden, sodann in dem Fall, dass 0101001 als
Codefolge empfangen wird, nicht unterschieden werden kann, ob es
sich dabei um 0, 101, 0, 01 oder um 01, 0, 10, 01 oder um 01, 01,
0, 01 handelt. Demgemäß muss bekannt
gegeben werden, dass eine Beschränkung auf
Codefolgen vorliegt, die genutzt werden können.
-
In
dem Fall, dass der Quantisierungsgenauigkeits-Informationscode gegeben
ist mit 010, sind die Werte der quantisierten Spektrumssignale in
der Reihenfolge von der Seite der niedrigen Frequenz aus gegeben
mit 0, –2,
1, 0. Wenn diese Signale in Codefolgen unter Heranziehung des Codefolgentabellenteiles
der Tabelle B transformiert werden, gemäß dem der Quantisierungsgenauigkeits-Informationscode
gegeben ist mit 010, dann sind die Spektrumssignalwerte gegeben
mit 0, 111, 100, 0, und ihre Codelängen betragen 1, 3, 3 bzw.
1.
-
Wie
aus der Tabelle B ersichtlich ist, werden die Codefolgen durch eine
Zahl erstellt, die gleich der Quantisierungsschrittzahl ist. Demgemäß werden beispielsweise
127 verschiedene Codefolgen in dem Fall erstellt, dass der Quantisierungsgenauigkeits-Informationscode
gegeben ist mit 111. Infolgedessen werden insgesamt 252 verschiedene
Codefolgen erstellt.
-
In
entsprechender Weise wird für
die codierte Einheit [3] ein weiterer Code 001 als Quantisierungsgenauigkeitsinformation
ausgewählt,
und die Quantisierung wird mit drei verschiedenen Schrittzahlen
bzw. Schritten ausgeführt.
Damit sind die Quantisierungsspektren gegeben mit 0, –1, 0, 0;
die Codefolgen sind gegeben mit 0, 11, 0, 0, und die Codelängen betragen
1, 2, 1, 1.
-
3 veranschaulicht
ein zweidimensionales Verfahren zur variablen Längencodierung. Falls eine solche
zweidimensionale Codefolgentabelle, wie sie aus der Tabelle C ersichtlich
ist, als Codefolgentabelle für
einen Fall verwendet wird, bei dem der Quantisierungsgenauigkeits-Informationscode
gegeben ist mit 001, dann werden die Quantisierungsspektren der
jeweiligen codierten Einheiten [1],[2] und [3], wie in 3 veranschaulicht,
zwei zu zwei in einer Gruppe gesammelt, die in eine Codefolge transformiert
wird. Demgemäß werden
quantisierte Spektren 0, –1,
0, 0 der codierten Einheit [3] gesammelt, wie zu (0, –1) und
(0, 0) und in zwei Codefolgen von 101, 0 transformiert.
-
In
dem Fall, dass die quantisierten Spektren 0, –1, 0, 0 der codierten Einheit
[3] in eindimensionale Codes variabler Länge codiert werden bzw. sind,
wie dies in 2 veranschaulicht ist, beträgt die erforderliche
Informationsmenge 1 + 2 + 1 + 1 = 5 Bits. Falls die Spektren demgegenüber in zweidimensionale Codes
variabler Länge
codiert werden bzw. sind, wie dies in 3 veranschaulicht
ist, dann beträgt
die Informationsmenge 3 + 1 = 4 Bits. Somit kann ersehen werden,
dass die Heranziehung der zweidimensionalen variablen Längencodierung
eine Codierung mit einer verringerten Informationsmenge ermöglicht.
-
Wie
oben beschrieben, kann durch Sammeln von zwei quantisierten Spektren
zu zweidimensionalen Daten und durch Codieren der zweidimensionalen
Daten in einen Code mit variabler Länge entsprechend einer Codefolgentabelle
die Codelänge
im Vergleich zu dem Fall verringert werden, dass ein eindimensionaler
Code variabler Länge
verwendet wird.
-
Falls
versucht wird, eine Vielzahl (N) von quantisierten Spektren in einer
Gruppe zu sammeln, um N-dimensionale Daten zu erhalten und um die N-dimensionalen
Daten in einen Code variabler Länge
entsprechend einer Codefolgentabelle zu codieren, dann ist ferner
ein sehr großer
Umfang für
die Codefolgentabelle erforderlich, was es schwierig macht, die
Codierungsvorrichtung in praktischen Gebrauch zu bringen, und dies
ist eine durch das Codierungsverfahren zu lösende Angelegenheit.
-
In
dem Fall, dass beispielsweise die quantisierten Spektren der in 3 dargestellten
codierten Einheit [3] unter Sammlung von vier Spektren in einer Gruppe
zu einer Codefolge, 34 transformiert werden, heißt dies, dass 81 Codefolgen
benötigt
werden.
-
Eine
Informationscodierungsvorrichtung, in der sämtliche Merkmale des Oberbegriffs
des Anspruchs 1 enthalten sind, ist in WO 95/02240 A beschrieben.
-
Zusammenfassung
der Erfindung
-
Eine
Aufgabe der vorliegenden Erfindung besteht darin, eine Informationscodierungsvorrichtung,
ein Informationscodierungsverfahren, eine Informationsdecodierungsvorrichtung,
ein Informationsdecodierungsverfahren und einen Informationsaufzeichnungsträger bzw.
-medium bereitzustellen, die eine Codierung/Decodierung mit einer
vergleichsweise kleinen Codelänge
ohne Steigerung des Umfangs einer Codefolgentabelle gestatten.
-
Gelöst wird
diese Aufgabe bzw. erreicht dieses Ziel durch eine Informationscodierungsvorrichtung,
ein Informationscodierungsverfahren, eine Informationsdecodierungsvorrichtung,
ein Informationsdecodierungsverfahren und einen Informationsaufzeichnungsträger bzw.
-medium gemäß den beigefügten unabhängigen Ansprüchen. Vorteilhafte Merkmale
der vorliegenden Erfindung sind in den entsprechenden Unteransprüchen festgelegt.
-
Durch
die vorliegende Erfindung kann eine Codierung mit einem hohen Wirkungsgrad
ohne Steigerung des Umfangs einer Codefolgentabelle erreicht werden,
und Codes mit einem hohen Kompressionswirkungsgrad können unter
Heranziehung einer Codefolgentabelle eines kleinen Umfangs decodiert werden.
Wenn ein Audiosignal unter Heranziehung eines Codierungsverfahrens
entsprechend einer Quantisierungsgenauigkeitsinformation des Signals codiert
wird, kann eine Codierung effizient ausgeführt werden. Auf dem Informationsaufzeichnungsträger bzw.
-medium gemäß der vorliegenden
Erfindung ist eine Information in einer höheren Dichte als jemals zuvor
aufgezeichnet.
-
Die
obigen sowie weitere Aufgaben, Merkmale und Vorteile der vorliegenden
Erfindung werden aus der folgenden Beschreibung und den beigefügten Ansprüchen in
Verbindung mit den beigefügten Zeichnungen
ersichtlich werden, in denen entsprechende Teile oder Elemente mit
entsprechenden Bezugszeichen bezeichnet sind.
-
Kurze Beschreibung
der Zeichnungen
-
1 veranschaulicht
in einer schematischen Darstellung Spektren einer codierten Einheit.
-
2 veranschaulicht
in einer schematischen Darstellung ein Codierungsverfahren gemäß einer
verwandten Technik, bei dem eine variable Längencodierung angewandt ist.
-
3 veranschaulicht
in einer schematischen Darstellung ein weiteres Codierungsverfahren gemäß der verwandten
Technik, welches eine mehrdimensionale variable Längencodierung
anwendet.
-
4 veranschaulicht
in einem Blockdiagramm einen Aufbau einer Codierungsvorrichtung, bei
der die vorliegende Erfindung angewandt ist.
-
5 veranschaulicht
in einem Blockdiagramm einen Aufbau einer in 4 dargestellten Transformationsschaltung.
-
6 veranschaulicht
in einem Blockdiagramm einen Aufbau einer in 4 dargestellten
Signalkomponenten-Codierungsschaltung.
-
7 veranschaulicht
in einem Blockdiagramm einen Aufbau einer Decodierungsvorrichtung, bei
der die vorliegende Erfindung angewandt ist.
-
8 veranschaulicht
in einem Blockdiagramm einen Aufbau einer in 7 dargestellten
Invers-Transformationsschaltung.
-
9 veranschaulicht
in einem Ablaufdiagramm ein Verfahren zur Codierung von Spektrumssignalen
gemäß der vorliegenden
Erfindung.
-
10 veranschaulicht
in einem Ablaufdiagramm ein Verfahren zur Decodierung von Spektrumssignalen
gemäß der vorliegenden
Erfindung.
-
11 und 12 veranschaulichen
in schematischen Diagrammen unterschiedliche Codierungsverfahren
gemäß der vorliegenden
Erfindung.
-
13 veranschaulicht
in einer schematischen Darstellung ein Codierungsverfahren gemäß der verwandten
Technik.
-
Tabelle
A zeigt eine Tabelle zur Veranschaulichung eines Verfahrens zur
Darstellung einer Quantisierungsgenauigkeitsinformation.
-
Tabelle
B zeigt eine Tabelle zur Veranschaulichung eines Beispiels einer
Codefolgetabelle.
-
Tabelle
C zeigt eine Tabelle zur Veranschaulichung eines Beispiels einer
mehrdimensionalen Codefolgentabelle gemäß der verwandten Technik.
-
Beschreibung
der bevorzugten Ausführungsformen
-
Bevor
bevorzugte Ausführungsformen
der vorliegenden Erfindung beschrieben werden, werden zur Verdeutlichung
der entsprechenden Beziehung zwischen den von der vorliegenden Erfindung,
wie sie in den beigefügten
Ansprüchen
festgelegt ist, herangezogenen Einrichtungen und Elementen der Ausführungsformen
der vorliegenden Erfindung verschiedene Aspekte der vorliegenden
Erfindung mittels Bezugszeichen der Elemente der Ausführungsformen
beschrieben, die den in den beigefügten Patentansprüchen festgelegten
Elementen in Klammern hinzugefügt
sind. Es versteht sich natürlich, dass
dies nicht so zu verstehen ist, dass die Beschreibung die in den
Patentansprüchen
festgelegten Einrichtungen bzw. Mittel auf jene der Ausführungsformen
beschränkt.
-
Eine
Informationscodierungsvorrichtung umfasst eine Diskriminierungs-
bzw. Unterscheidungseinrichtung (beispielsweise den Schritt S1 im
Programm gemäß 9)
zur Unterscheidung eines Informationsmusters jeder der Gruppen und
eine Codierungseinrichtung (beispielsweise die Schritte S2, S3 und
S4 in dem Programm gemäß 9)
zur Codierung in dem Fall, dass die Information irgendeiner Gruppe
eine Information eines bestimmten Musters ist, der Gruppe in dem
kürzesten
Code, während
in dem Fall, dass die Information der Gruppe eine Information ist,
die von der Information des bestimmten Musters verschieden ist,
eine Codierung von Teilen der Information der Gruppe in entsprechende
Codes erfolgt.
-
Eine
Informationscodierungsvorrichtung enthält eine Aufteilungseinrichtung
(beispielsweise die Vorwärts-Spektrums-Transformationsschaltungen 12 und 13 gemäß 5)
zur Aufteilung von Signalen in bestimmte codierte Einheiten, eine
Entscheidungseinrichtung (beispielsweise die Quantisierungsgenauigkeits-Bestimmungsschaltung 23 gemäß 6)
zur Bestimmung der Quantisierungsgenauigkeitsinformation für jede der
codierten Einheiten, eine Quantisierungseinrichtung (bei spielsweise
die Quantisierungsschaltung 22 gemäß 6) zur Quantisierung
der Signale auf die Quantisierungsgenauigkeitsinformation hin und
eine Codierungseinrichtung (beispielsweise die Codefolgen-Erzeugungsschaltung 3 gemäß 1)
zur Codierung des jeweiligen Signals unter Heranziehung eines Codierungsverfahrens
entsprechend der Quantisierungsgenauigkeitsinformation.
-
Eine
Informationsdecodierungsvorrichtung umfasst eine Diskriminierungs-
bzw. Unterscheidungseinrichtung (beispielsweise den Schritt S11
in dem Programm gemäß 10)
zur Unterscheidung, ob eine Vielzahl von Informationsteilen der
jeweiligen Gruppe eine Information eines bestimmten Musters ist
oder nicht, und eine Decodierungseinrichtung (beispielsweise die
Schritte S12 und S13 in dem Programm gemäß 10 zum
Decodieren, wenn die Vielzahl der Informationsteile irgendeiner
Gruppe gegeben ist durch eine Information eines bestimmten Musters,
von Codes der Gruppe in eine Vielzahl von Informationsteilen eines
gleichen Wertes, während
in dem Fall, dass die Vielzahl der Informationsteile irgendeiner
Gruppe gegeben ist durch eine Information, die von der Information
des bestimmten Musters verschieden ist, eine Decodierung von Codes
der Gruppe in individuelle entsprechende Informationsteile erfolgt.
-
In 4 ist
in einem Blockdiagramm ein Aufbau einer Codierungsvorrichtung für ein akustisches Wellenformsignal
veranschaulicht, bei der die vorliegende Erfindung angewandt ist.
Eine Signalwellenform 101, die der dargestellten Codierungsvorrichtung
eingangsseitig zugeführt
wird, wird durch eine Transformationsschaltung 1 in Signalfrequenzkomponenten 102 transformiert.
Die Signalfrequenzkomponenten 102 werden durch eine Signalkomponenten-Codierungsschaltung 2 individuell
codiert, und Codegruppen werden mittels einer Codefolgen-Erzeugungsschaltung 3 aus
den Codes von der Signalkomponenten-Codierungsschaltung 2 erzeugt.
Die Codefolgen werden durch bzw. über eine bestimmte Übertragungsleitung übertragen
und/ oder auf einem Informationsaufzeichnungsträger bzw. -medium 4 aufgezeichnet.
-
5 veranschaulicht
eine beispielhafte Form der Transformationsschaltung 1 gemäß 4. Gemäß 5 wird
ein der Transformationsschaltung 1 eingangsseitig zugeführtes Signal 201 mittels
eines Subbandfilters 11 in zwei Signalkomponenten 211 und 212 unterschiedlicher
Bänder
aufgeteilt. Die Signalkomponenten 211 und 212 werden
durch Vorwärts-Spektrums-Transformationsschaltungen 12 und 13 in
Spektrumssignalkomponenten 221 und 222 transformiert;
die betreffenden Transformationsschaltungen führen eine Transformation, wie
eine MDCT-Transformation
aus. Die Bandbreiten der Signale 211 und 212 sind
gleich einer Hälfte
der Bandbreite des Signals 201 (d.h. die betreffenden Signale sind
auf 1/2 in Bezug auf das Signal 201 ausgedünnt). Es
sei darauf hingewiesen, dass das Signal 201 gemäß 5 der
Signalwellenform 101 von 4 entspricht
und dass die Signale 221 und 222 gemäß 5 dem
Signal 102 gemäß 4 entsprechen.
-
Die
Transformationsschaltung 1 kann verschiedene andere Formen
aufweisen. So kann die Transformationsschaltung 1 beispielsweise
ein Eingangssignal durch die MDCT-Transformation oder nicht durch
die MDCT-Transformation, sondern durch die DFT- oder DCT-Transformation,
die zur Transformation benutzt werden können, direkt in Spektrumssignale
transformieren.
-
Obwohl
es möglich
ist, eine Verarbeitung lediglich dadurch vorzunehmen, dass ein Signal
mittels eines Subbandfilters in Bandkomponenten unterteilt wird,
ohne dass das Signal in Spektrumssignale transformiert wird, ist
es mit Rücksicht
darauf, dass das Verfahren gemäß der vorliegenden
Erfindung insbesondere dort effektiv wirksam ist, wo Energie auf
bzw. bei einer bestimmten Frequenz konzentriert ist, von Vorteil,
ein Verfahren anzuwenden, bei dem ein Signal mittels der oben beschriebenen
Spektrumstransformation in Frequenzkomponenten transformiert wird,
wobei mittels der betreffenden Spektrums transformation eine große Anzahl
von Frequenzkomponenten durch einen vergleichsweise geringen Rechenumfang
erhalten werden kann.
-
6 veranschaulicht
eine beispielhafte Form der Signalkomponenten-Codierungsschaltung 2 gemäß 4.
Gemäß 6 wird
jede Signalkomponente 301 zunächst für das jeweils bestimmte Band
mittels einer Normierungsschaltung 21 normiert und dann
als Signal 302 einer Quantisierungsschaltung 22 eingangsseitig
zugeführt.
Das Signal 302 wird dann mittels der Quantisierungsschaltung 22 entsprechend
einem Quantisierungsgenauigkeitssignal 303 quantisiert,
welches durch eine Quantisierungsgenauigkeits-Bestimmungsschaltung 23 berechnet
ist, und das betreffende Signal wird als Signal 304 von
der Quantisierungsschaltung 22 abgegeben. Während die
Signalkomponente 301 gemäß 6 den Signalfrequenzkomponenten 102 gemäß 4 entspricht
und während
das Signal 304 gemäß 6 dem
Signal 103 gemäß 4 entspricht,
enthält
das Signal 304 (103) zusätzlich zu einer quantisierten
Signalkomponente eine Normierungskoeffizienteninformation und eine
Quantisierungsgenauigkeitsinformation.
-
7 veranschaulicht
in einem Blockdiagramm einen Aufbau einer Decodierungsvorrichtung gemäß der vorliegenden
Erfindung; diese Decodierungsvorrichtung führt eine Decodierung und Abgabe eines
akustischen Signals von einer Codefolge aus, die durch die in 4 dargestellte
Codierungsvorrichtung erzeugt wird. Gemäß 7 wird in
der dargestellten Decodierungsvorrichtung eine zu dieser übertragene
oder von dem Informationsaufzeichnungsträger bzw. -medium 4 wiedergegebene
Codefolge 401 einer Codefolgen-Zerlegungsschaltung 41 eingangsseitig
zugeführt,
durch die Codes 402 einzelner Signalkomponenten extrahiert
werden. Die Codes 402 werden mittels einer Signalkomponenten-Decodierungsschaltung 42 in
Signalkomponenten 403 decodiert, und aus den Signalkomponenten 403 wird
von einer Invers-Transformationsschaltung 43 ein akustisches
Wellenformsignal 404 erzeugt und abgegeben.
-
8 veranschaulicht
eine beispielhafte Form der Invers-Transformationsschaltung 43 gemäß 7.
Gemäß 8 entspricht
die dargestellte Invers-Transformationsschaltung 43 der
Form der in 5 dargestellten Transformationsschaltung 1.
Insbesondere werden Signale 501 und 502 Invers-Spektrums-Transformationsschaltungen 51 und 52 eingangsseitig
zugeführt,
durch die Signale 511 bzw. 512 unterschiedlicher
Bänder
erhalten werden. Die Signale 511 und 512 werden
durch ein Bandzusammensetzungs- bzw. Bandbildungsfilter 53 gebildet
und von dem Bandbildungsfilter 53 als Signal 521 abgegeben.
Die Signale 501 und 502 gemäß 8 entsprechen
den Signalkomponenten 403 gemäß 7, und das
Signal 521 gemäß 8 entspricht dem
akustischen Wellenformsignal 404 gemäß 7.
-
Anschließend wird
die Arbeitsweise der in 4 bis 6 dargestellten
Codierungsvorrichtung beschrieben. Zunächst wird auf 5 Bezug
genommen, gemäß der ein
akustisches Wellenformsignal 201 (101 in 4)
dem Subbandfilter 11 der Transformationsschaltung 1 eingangsseitig
zugeführt
und durch das Subbandfilter 11 in eine Signalkomponente 211 einer
vergleichsweise niedrigen Frequenz sowie in eine weitere Signalkomponente 212 einer
vergleichsweise hohen Frequenz aufgeteilt wird. Die Signalkomponente 211 der
vergleichsweise niedrigen Frequenz wird der Vorwärts-Spektrums-Transformationsschaltung 12 eingangsseitig
zugeführt
und durch diese Vorwärts-Spektrums-Transformationsschaltung 12 in
eine Spektrumssignalkomponente 221 transformiert. In entsprechender
Weise wird die Signalkomponente 212 der vergleichsweise
hohen Frequenz der Vorwärts-Spektrums-Transformationsschaltung 13 eingangsseitig
zugeführt
und durch diese Vorwärts-Spektrums-Transformationsschaltung 13 in
eine Spektrumssignalkomponente 222 transformiert und von
der betreffenden Transformationsschaltung abgegeben.
-
Unter
Bezugnahme auch auf 1 sei angemerkt, dass die Vorwärts-Spektrums-Transformationsschaltung 12 Spektrumssignale einer
vergleichsweise niedrigen Frequenz in Einheiten transformiert, um
codierte Einheiten [1] bis [3] zu erzeugen. Unterdessen transformiert
die Vorwärts-Spektrums-Transformationsschaltung 13 Spektrumssignale
einer vergleichsweise hohen Frequenz in Einheiten, um codierte Einheiten
[4] bis [6] zu erzeugen.
-
Jede
der von den Vorwärts-Spektrums-Transformationsschaltungen 12 und 13 abgegebenen
Spektrumssignalkomponenten 221 und 222 (102)
wird der Normierungsschaltung 21 und der Quantisierungsgenauigkeits-Bestimmungsschaltung 23 der
Signalkomponenten-Codierungsschaltung 2 eingangsseitig
zugeführt.
Die Normierungsschaltung 21 teilt die Werte der Vielzahl
der Spektrumssignalkomponenten in jeder codierten Einheit durch
einen Maximalwert aus den Werten der Spektrumssignalkomponenten,
um die Spektrumssignalkomponenten zu normieren. Sodann werden die
durch die Normierung erhaltenen Normierungskoeffizienten 302 an
die Quantisierungsschaltung 22 abgegeben.
-
Die
Quantisierungsgenauigkeits-Bestimmungsschaltung 23 berechnet
einen minimal hörbaren
Pegel oder einen Maskierungspegel für ein der jeweiligen codierten
Einheit entsprechendes Band, um die Quantisierungsgenauigkeit der
dort in Einheiten einer codierten Einheit eingangsseitig zugeführten Spektrumssignalkomponenten
zu bestimmen. Die Quantisierungsschaltung 22 quantisiert
die Normierungskoeffizienten 302, die ihr von der Normierungsschaltung 21 zugeführt sind,
mit dem Quantisierungsgenauigkeitssignal 303, welches ihr
von der Quantisierungsgenauigkeits-Bestimmungsschaltung 23 zugeführt ist,
um ein Quantisierungssignal 304 (103) zu erhalten,
und sie gibt das Quantisierungssignal 304 (103)
an die Codefolgen-Erzeugungsschaltung 3 ab.
Die Codefolgen-Erzeugungsschaltung 3 transformiert die
quantisierten Spektrumssignale in Codefolgen entsprechend der in
dem Ablaufdiagramm gemäß 9 veranschaulichten
Verarbeitung.
-
Gemäß 9 bezeichnet
ein Bezugszeichen QSP(i) die quantisierten Spektrumssignale, und N
stellt die Anzahl der zu einem Zeitpunkt zu codierenden Spektrumssignale
dar. Es kann in Betracht gezogen werden, dass N ein Wert ist, der
der Folgezahl einer variablen Längencodierung
entspricht.
-
Zunächst werden
beim Schritt S1 die Werte der N quantisierten Spektrumssignale QSP(M)
bis QSP(M + N – 1) überprüft; wenn
alle gleich 0 sind, geht die Steuerfolge weiter zum Schritt S2,
bei dem 0 als Codefolge der N Spektren codiert wird. Falls jedoch
irgendein von 0 verschiedener Wert aus bzw. bei irgendeinem der
N Spektrumssignale ermittelt wird, geht die Steuerfolge sodann weiter
zum Schritt S3, bei dem 1 als Codefolge codiert wird. Danach geht
die Steuerfolge weiter zum Schritt S4, bei dem die quantisierten
Spektrumssignale QSP(M) bis QSP(M + N – 1) aufeinanderfolgend codiert
werden. Die Codierung der quantisierten Spektrumssignale QSP(M)
bis QSP(M + N – 1)
wird in ähnlicher
bzw. entsprechender Weise ausgeführt
wie bei der eindimensionalen Codierung gemäß der verwandten Technik.
-
Anschließend wird
die Arbeitsweise der in 7 und 8 dargestellten
Decodierungsvorrichtung beschrieben. Ein der Decodierungsvorrichtung von
der in 4 dargestellten Codierungsvorrichtung übertragenes
oder von dem Informationsaufzeichnungsträger bzw. -medium 4 wiedergegebenes Signal 401 wird
der Codefolgen-Zerlegungsschaltung 41 eingangsseitig zugeführt. Die
Codefolgen-Zerlegungsschaltung 41 führt eine Codefolgen-Zerlegungsverarbeitung
in einer solchen Weise durch, wie sie in dem Ablaufdiagramm gemäß 10 veranschaulicht
ist.
-
Gemäß 10 bezeichnet
in entsprechender Weise wie bei der in 9 dargestellte
Codierungsverarbeitung das Bezugszeichen QSP(i) die quantisierten
Spektrumssignale, und N repräsentiert die
Anzahl der zu einem Zeitpunkt zu decodierenden Spektrumssignale.
Zunächst
wird beim Schritt S11 das erste Bit der codierten Codefolge gelesen;
falls der so gelesene Code gegeben ist mit 0, geht die Steuerfolge
sodann weiter zum Schritt S12, bei dem die Werte der quantisierten
Spektrumssignale QSP(M) bis QSP(M + N – 1) alle auf 0 gesetzt werden.
Wenn demgegenüber
beim Schritt S11 bestimmt wird, dass das erste Bit der codierten
Codefolge nicht 0 ist, d.h. dann, wenn das erste Bit gegeben ist
mit 1, geht die Steuerfolge sodann weiter zum Schritt S13, bei dem
die quantisierten Spektrumssignale QSP(M) bis QSP(M + N – 1) der
Codefolge individuell und aufeinanderfolgend decodiert werden, und
zwar beginnend mit dem zweiten Bit der Codefolge. Die Decodierung
der quantisierten Spektrumssignale QSP(M) bis QSP(M + N – 1) wird
in einer ähnlichen
bzw. entsprechenden Weise ausgeführt
wie bei der eindimensionalen Decodierung gemäß der verwandten Technik.
-
Die
auf diese Weise durch die Zerlegung mittels der Codefolgen-Zerlegungsschaltung 41 erhaltenen
Signale 402 werden der Signalkomponenten-Decodierungsschaltung 42 eingangsseitig
zugeführt und
durch diese decodiert. Die Signalkomponenten-Decodierungsschaltung 42 führt eine
inverse Verarbeitung zu jener der in 6 dargestellten
Signalkomponenten-Codierungsschaltung 2 aus.
-
Sodann
wird eine der von der Signalkomponenten-Decodierungsschaltung 42 abgegebenen
Signalkomponenten 403, die eine vergleichsweise niedrige
Frequenz besitzt, das ist die Spektrumssignalkomponente 501,
der Invers-Spektrums-Transformationsschaltung 51 eingangsseitig
zugeführt,
während
die andere Signalkomponente der betreffenden Signalkomponenten 403,
die eine vergleichsweise hohe Frequenz besitzt, das ist die Spektrumssignalkomponente 502,
der Invers-Spektrums-Transformationsschaltung 52 eingangsseitig
zugeführt
wird. Die Invers-Spektrumstransformationsschaltungen 51 und 52 transformieren
die ihnen eingangsseitig zugeführten
Spektrumssignalkomponenten 501 bzw. 502 zu akustischen
Signalen 511 bzw. 512 auf der Zeitbasis, und sie
gegen die akustischen Signale 511 bzw. 512 an
das Bandzusammensetzungsfilter 53 ab. Das Bandzusammensetzungsfilter 53 setzt
das akustische Signal 511 einer vergleichsweise niedrigen
Frequenz und das akustische Signal 512 einer vergleichsweise
hohen Frequenz zu einem zusammengesetzten akustischen Signal 521 (404)
zusammen und gibt das akustische Signal 521 (404)
ab.
-
11 veranschaulicht
in einer schematischen Darstellung ein detailliertes Beispiel auf
eine Codierung von Spektrumssignalen gemäß der vorliegenden Erfindung
hin. Insbesondere veranschaulicht 11 eine
Art und Weise, in der Spektrumssignale in einer codierten Einheit
codiert werden bzw. sind. Bei der in 11 dargestellten
Codierungsweise werden jeweils zwei benachbarte Spektrumssignale zu
einer Gruppe gesammelt, und es wird eine Codierung für die Gruppe
ausgeführt.
Wie aus 11 ersehen werden kann, werden
dann, wenn die durch Quantisieren von zwei benachbarten Spektrumssignalen
erhaltenen Werte alle gleich 0 sind (wenn beim Schritt S1 die Bestimmung
JA lautet), die beiden Spektrumssignale zu einer Codegruppe von
0 (Schritt S2) codiert; in jedem anderen Fall (wenn die Bestimmung
beim Schritt S1 NEIN lautet), beispielsweise dann, wenn die durch
Quantisieren von zwei Spektrumssignalen erhaltenen Werte gegeben
sind mit –2
und 3, werden die beiden Spektrumssignale sodann zu einer anderen
Codefolge von 1 (Schritt S3) transformiert. Sodann werden die Quantisierungswerte –2 und 3
aufeinanderfolgend zu 1101 bzw. 1110 codiert. Dazu wird beispielsweise
der Codefolgen-Tabellenteil der oben beschriebenen Tabelle B herangezogen.
Es wird berücksichtigt,
dass dies unter Heranziehung des eindimensionalen Codefolgen-Tabellenteiles
der Tabelle B eine zweidimensionale variable Längencodierung künstlich
realisiert. Wie in 11 veranschaulicht, beträgt die Codelänge der
codierten Einheit sodann 12 (= 1 + 1 + 4 + 4 + 1 + 1).
-
12 veranschaulicht
in entsprechender Weise in einer schematischen Darstellung eine
Art und Weise, in der vier Spektren kollektiv codiert werden. Außerdem ist
in diesem Fall berücksichtigt,
dass unter Heranziehung des eindimensionalen Codefolgen-Tabellenteiles
eine vierdimensionale variable Längencodierung
künstlich
realisiert wird.
-
Bei
der vorliegenden Codierung werden insbesondere vier Quantisierungsspektren
0, 0, –2,
3 entsprechend dem Codefolgen-Tabellenteil
der Tabelle B für
den Quantisierungsgenauigkeits-Informationscode von 011 (Schritt
S4) zu 0, 0, 1101, 1110 individuell quantisiert. Sodann wird zum
Zwecke eine Identifizierung dem Anfang jener Codefolgen (Schritt S3)
eine 1 hinzugefügt.
Ferner werden vier aufeinanderfolgende Quantisierungsspektren 0,
0, 0, 0 zu 0 codiert (Schritt S2). Demgemäß beträgt die Codelänge der
codierten Einheit in diesem Fall 12 (= 1 + 1 + 1 + 4 + 4 + 1).
-
Bei
den in 11 und 12 dargestellten Arten
der Codierung werden Spektrumssignale in einer codierten Einheit
mit einer Informationsmenge von 12 Bits codiert. Vergleichshalber
ist hier eine Art und Weise der Codierung, bei der Spektrumssignale nach
einem Verfahren codiert werden, welches die eindimensionale variable
Längencodierung
gemäß der verwandten
Technik anwendet (ein Codefolgen-Tabellenteil der Tabelle B), in 13 veranschaulicht.
Wie aus 13 ersichtlich ist, beträgt die Informationsmenge
in diesem Fall 14 Bits. Demgemäß kann ersehen
werden, dass die Verfahren eine Codierung mit einer geringeren Informationsmenge erzielen
können.
-
Zum
Vergleich wird hier der Umfang des Codefolgen-Tabellenteiles, in
welchem der Quantisierungsgenauigkeits-Informationscode gemäß 13 gegeben
ist mit 011, wenn ein Codefolgen-Tabellenteil, der übermäßig bei
der zweidimensionalen und vierdimensionalen variablen Längencodierung
angewandt wird, nach dem Verfahren gemäß der verwandten Technik erzeugt
wird, berechnet. Die Berechnung belegt, dass beim Umfang von sieben
Wörtern,
bei dem die eindimensionale variable Längencodierung angewandt ist,
im Falle der Anwendung der zweidimensionalen variablen Längencodierung ein
Codefolgen-Tabel lenteil von 49 Wörtern
erforderlich ist und dass bei Anwendung der vierdimensionalen variablen
Codierung ein Codefolgen-Tabellenteil von 2401 Wörtern benötigt wird.
-
Generell
ist bei einem akustischen Wellenformsignal in den meisten Fällen die
Energie bei einer Grundfrequenz und bei Frequenzkomponenten konzentriert,
die gleich ganzzahligen Vielfachen der Grundfrequenz sind, das sind
Harmonische bzw. Oberwellenkomponenten; sogar dann, wenn Spektrumssignale
von Frequenzkomponenten, die von der Grundfrequenz oder den Oberwellenkomponenten
verschieden sind, quantisiert werden, sind die erhaltenen Werte
in den meisten Fällen
gleich Null. Wenn die Grundfrequenz zunimmt, da das Intervall zwischen
Oberwellenkomponenten zunimmt, steigt die Wahrscheinlichkeit für das Auftreten
von Quantisierungsspektren von 0. Da ein ausreichender Störabstand
im bzw. für
den Gehörsinn
dann nicht gewährleistet
werden kann, wenn die Quantisierungsgenauigkeit für Signale
mit solchen Frequenzkomponenten nicht erhöht wird, um sie zu quantisieren,
wird ferner eine beachtlich große
Informationsmenge verbraucht. Insbesondere in einem Band, in welchem
die Breite einer codierten Einheit groß ist, ist die verbrauchte
Informationsmenge groß.
-
Um
eine Codierung für
solche Signale effizient auszuführen,
werden somit Spektrumssignale, die zu 0 quantisiert sind, mit einer
verringerten Informationsmenge codiert. Wie oben beschrieben, realisiert
das Verfahren gemäß der vorliegenden
Erfindung eine effiziente Codierung ohne Steigerung des Umfangs
einer Codefolgentabelle.
-
Während oben
die Ausführungsform
beschrieben worden ist, bei der mittels eines Spektrumsfilters gefilterte
und mittels einer MDCT-Transformation einer Spektrumstransformation
unterzogene Signale von der Bandaufteilungsschaltung abgegeben werden
und bei der durch eine inverse MDCT-Transformation (IMDCT) einer
inversen Spektrumstransformation unterzogene und mittels eines Bandzerlegungsfilters
gefilterte Signale von der Bandzerlegungsschaltung abgegeben werden,
ist es selbstverständlich,
dass die MDCT-Transformation oder die IMDCT-Transformation direkt
ohne Verwendung eines Subbandfilters oder eines Bandzusammensetzungsfilters
ausgeführt
werden können.
Ferner ist die Art der Spektrumstransformation nicht auf die MDCT-Transformation
beschränkt;
vielmehr kann statt dessen die DFT-Transformation, die DCT-Transformation
oder irgendeine andere Transformation angewandt werden.
-
Ferner
braucht die Spektrumstransformation nicht notwendigerweise angewandt
zu werden; vielmehr können
eine Bandaufteilung oder eine Bandzusammensetzung lediglich mittels
eines Subbandfilters oder eines Bandzusammensetzungsfilters ausgeführt werden.
In diesem Fall werden ein Band, welches durch Aufteilung mittels
eines Filters erhalten wird, oder eine Vielzahl derartiger Aufteilungsbänder als
eine codierte Einheit verarbeitet. Durch Aufbau einer codierten
Einheit, wie er zuvor in Verbindung mit der Ausführungsform beschrieben worden
ist, nach Ausführen
einer Spektrumstransformation, wie der MDCT-Transformation, zur
Transformation eines akustischen Wellenformsignals in eine große Anzahl von
Spektrumssignalen kann das Verfahren gemäß der vorliegenden Erfindung
indessen effizient angewandt werden.
-
Während oben
die Verarbeitung eines akustischen Wellenformsignals beschrieben
worden ist, kann das Verfahren gemäß der vorliegenden Erfindung
ferner bei verschiedenen Arten von Signalen angewandt werden, und
sie kann beispielsweise auch bei einem Videosignal angewandt werden.
Da die vorliegende Erfindung eine Charakteristik eines akustischen
Wellenformsignals ausnutzt, um eine effiziente Codierung zu realisieren,
bei der viele Spektrumssignale, die zu 0 quantisiert werden, involviert sind,
ist das Verfahren gemäß der vorliegenden
Erfindung in dem Fall effektiv, in dem es für ein akustisches Wellenformsignal
angewandt wird.
-
Ferner
kann das Verfahren gemäß der vorliegenden
Erfindung in Kombination mit dem Verfahren der verwandten Technik
benutzt werden, welches eine variable Längencodierung anwendet. So
ist es beispielsweise effektiver, unter Berücksichtigung des Umfangs der
Codefolgentabelle in dem Fall, dass die Quantisierungsgenauigkeit
gering ist, d.h. in dem Fall, dass die Quantisierungsschrittzahl
gering ist, eine Codierung nach dem Verfahren gemäß der verwandten
Technik unter Heranziehung einer zweidimensionalen oder vierdimensionalen
Codefolgentabelle auszuführen,
jedoch in dem Fall, dass die Quantisierungsgenauigkeit hoch ist,
d.h. dann, wenn die Quantisierungsschrittgröße groß ist, eine Codierung unter
Heranziehung des Verfahrens gemäß der vorliegenden
Erfindung auszuführen.