DE69635973T2

DE69635973T2 - Audio-Teilbandkodierverfahren

Info

Publication number: DE69635973T2
Application number: DE69635973T
Authority: DE
Inventors: Osamu Shinagawa-ku Shimoyoshi; Kyoya Shinagawa-ku Tsutsui
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1995-11-10
Filing date: 1996-11-08
Publication date: 2006-11-09
Anticipated expiration: 2016-11-09
Also published as: US5983175A; KR100460354B1; ES2256853T3; JPH09135176A; EP0773634A2; DE69635973D1; KR970029015A; JP3475985B2; EP0773634B1; EP0773634A3

Description

Vorrichtung und Verfahren zur Informationscodierung und zur Informationsdecodierung sowie Informationsaufzeichnungsträger mit codierten Daten
Hintergrund der Erfindung
Die Erfindung bezieht sich auf eine Informationscodierungsvorrichtung und ein Informationscodierungsverfahren, auf ein Informationsdecodierungsverfahren und eine Informationsdecodierungsvorrichtung sowie auf einen Informationsaufzeichnungsträger bzw. -medium, und sie bezieht sich insbesondere auf eine Informationscodierungsvorrichtung und ein Informationscodierungsverfahren, auf ein Informationsdecodierungsverfahren und eine Informationsdecodierungsvorrichtung sowie auf einen Informationsaufzeichnungsträger bzw. -medium, die geeignet sind für die Verwendung zum Codieren von eingangsseitigen Digitaldaten durch eine einen hohen Wirkungsgrad aufweisende Codierung und zur Übertragung, Aufzeichnung, Wiedergabe und Decodierung der codierten Digitaldaten, um ein Wiedergabesignal zu erhalten.
Variable Verfahren zur Codierung eines Audio- oder Sprachsignals mit hohem Wirkungsgrad sind verfügbar und umfassen beispielsweise eine Subbandcodierung (SBC), bei der es sich um ein ohne Blockbildung arbeitendes Frequenzband-Unterteilungsverfahren handelt, gemäß dem ein Audiosignal oder dergleichen Signal auf der Zeitbasis nicht zu Blöcken gebildet wird, sondern in eine Vielzahl von Frequenzbändern unterteilt und codiert wird, und eine Transformationscodierung, bei der es sich um ein Blockbildungs-Frequenzband-Unterteilungsverfahren handelt, gemäß dem ein Signal auf der Zeitbasis in ein anderes Signal auf der Frequenzbasis transformiert (im Spektrum transformiert) und in eine Vielzahl von Frequenzbändern un terteilt und sodann bezüglich jedes Frequenzbandes codiert wird.
Außerdem ist ein Verfahren zur Hochfrequenzcodierung verfügbar, das eine Kombination aus der Subbandcodierung und der oben beschriebenen Transformationscodierung umfasst. Bei diesem Verfahren wird beispielsweise zuerst eine Bandunterteilung durch eine Subbandcodierung ausgeführt, und sodann werden die Signale im jeweiligen Band in Signale auf der Zeitbasis im Spektrum transformiert, woraufhin eine Codierung bezüglich der im Spektrum transformierten Signale für das jeweilige Band ausgeführt wird. Dabei kann beispielsweise ein Quadratur-Spiegelfilter als Filter für die oben erwähnte Bandaufteilung verwendet werden. Das Quadratur-Spiegelfilter ist beispielsweise angegeben von R. E. Crochiere in "Digital coding of speech in subbands", Bell Syst. Tech. J., Vol. 55, No. 8, 1976.
Unterdessen ist ein Filteraufteilungsverfahren zur Aufteilung in gleiche Bandbreiten angegeben von Joseph H. Rothweiler in "Polyphase Quadrature filters – A new subband coding technique", ICASSP 83, BOSTON. Hier steht als die oben erwähnte Spektrums-Transformation eine Spektrums-Transformation zur Verfügung, bei der beispielsweise ein eingangsseitiges Audiosignal mit einer bestimmten Einheitszeit (Rahmen) zu Blöcken gebildet wird und bei der eine diskrete Fouriertransformation (DFT), eine diskrete Cosinustransformation (DCT) oder eine modifizierte diskrete Cosinustransformation (MDCT) für jeden Block ausgeführt wird, um das Signal der Zeitbasis in ein anderes Signal der Frequenzbasis zu transformieren. Die MDCT-Transformation ist beispielsweise angegeben von J.P. Princen und A.B. Bradley in "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation", Univ. des Surrey Royal Melbourne Inst. of Tech., ICASSP, 1987.
Durch auf diese Weise mittels einer Filter- oder Spektrums-Transformation auf einzelne Bänder aufgeteilte Quantisierungssignale kann ein Band, in welchem Quantisierungsrauschen hervorgerufen ist, gesteuert werden, und eine Codierung mit einem höheren Wirkungsgrad hinsichtlich der Hörbarkeit kann dadurch erreicht werden, dass von einer Eigenschaft eines Maskierungseffekts oder eines ähnlichen Effekts Gebrauch gemacht wird. Falls eine Normierung bezüglich jedes Bandes vorgenommen wird, kann hier vor der Ausführung der Quantisierung mit einem Maximalwert aus Absolutwerten von Signalkomponenten in dem Band eine Codierung mit einem weit höheren Wirkungsgrad erwartet werden.
Als Frequenzaufteilungsbreite zur Quantisierung der frequenzbandmäßig aufgeteilten Frequenzkomponenten wird eine Bandaufteilung ausgeführt, gemäß der beispielsweise die Gehörsinncharakteristik eines Menschen berücksichtigt wird. So wird insbesondere ein Audiosignal in der Frequenz in eine Vielzahl von Bändern (beispielsweise in 25 Bänder) aufgeteilt, deren Bandbreite mit zunehmender Frequenz bis zu einem hohen Frequenzband zunimmt, das normalerweise als kritisches Band bezeichnet wird. Auf eine in diesem Fall in jedem Band erfolgende Datencodierung hin wird ferner eine Codierung mit einer bestimmten Bitzuweisung für die einzelnen Bänder oder mit einer adaptiven Bitzuweisung für die einzelnen Bänder ausgeführt.
Auf eine Codierung von Koeffizientendaten hin, die mittels der oben erwähnten MDCT-Verarbeitung durch die Bitzuweisung erhalten werden, werden die MDCT-Koeffizientendaten in jedem Band, die durch die MDCT-Verarbeitung für jeden der oben erwähnten Blöcke erhalten werden, mit einer adaptiven Zuweisungsbitzahl codiert. Die folgenden beiden Verfahren sind für die Bitzuweisung bekannt.
Das erste Verfahren ist angegeben von R. Zelinski und P. Noll in "Adaptive Transform Coding of Speech Signals", IEEE Tran sactions of Acoustics, Speech, and Signal processing, Vol. ASSP-25, No. 4, August 1977. Hier erfolgt eine Bitzuweisung auf der Grundlage der Größe eines Signals für das jeweilige Band. Mit dem Verfahren werden flache Quantisierungsrauschspektren erhalten, und die Rauschenergie ist minimiert. Da der Maskierungseffekt auf den Gehörsinn nicht genutzt wird, ist indessen der tatsächliche Rauscheindruck nicht optimal.
Das zweite Verfahren ist angegeben von M. A. Kransner in "The critical band order-digital encoding of the perceptual requirements of the auditory system", ICASSP, MIT, 1980. Das Dokument rezitiert ein Verfahren, bei dem eine Gehörsinnmaskierung dazu herangezogen wird, einen geforderten Rauschabstand für jedes Band zu erzielen, um eine feste Bitzuweisung vorzunehmen. Bei dem Verfahren zeigt jedoch sogar dann, wenn eine Charakteristik mittels eines Sinuswellen-Eingangssignals gemessen wird, der Charakteristikwert wegen der festliegenden Bitzuweisung keinen sehr guten Wert.
Um solche Probleme zu lösen, ist eine hocheffiziente Codierungsvorrichtung vorgeschlagen worden, bei der sämtliche Bits, die für eine Bitzuweisung verwendet werden können, aufteilungsmäßig als Bits für ein festes Bitzuweisungsmuster verwendet werden, welches im Voraus für jeden Subblock festgelegt wird, und bei der Bits, die für eine Bitzuweisung herangezogen werden, welche sich auf die Größe eines Signals des jeweiligen Blocks stützt, und das Aufteilungsverhältnis zwischen ihnen auf der Grundlage eines Signals festgelegt ist, welches sich auf ein Eingangssignal bezieht, so dass das Aufteilungsverhältnis bezüglich des festen Bitzuweisungsmusters zunimmt, wenn die Spektren der oben erwähnten Signale gleichmäßiger werden.
Wenn bei der oben beschriebenen Vorrichtung Energie in einem bestimmten Spektrum konzentriert ist, wie in dem Fall, dass eine Sinuswelle eingegeben wird, wird eine vergleichsweise große Zahl von Bits dem Block zugewiesen, der das Spektrum enthält, wodurch die Gesamt-Störabstandscharakteristik merklich verbessert werden kann. Da der Gehörsinn des Menschen für ein Signal sehr empfindlich ist, welches eine steile Spektrumskomponente aufweist, verbessert eine Verbesserung in der Störabstandscharakteristik durch Anwendung eines derartigen Verfahrens, wie es oben beschrieben ist, generell nicht nur den Wert bei der Messung, sondern sie ist auch hinsichtlich der Verbesserung in der Tonqualität auf den Gehörsinn wirksam.
Für die Bitzuweisung sind viele weitere verschiedene Verfahren vorgeschlagen worden, und das Modell bezüglich des Gehörsinns ist feiner ausgebildet worden. Falls eine Codierungsvorrichtung hinsichtlich der Fähigkeit verbessert ist, dann wird eine Codierung mit einem höheren Wirkungsgrad hinsichtlich des Gehörsinns erreicht.
Die Erfinder der vorliegenden Erfindung haben in der PCT-Anmeldung PCT/JP94/00880, eingereicht am 31. Mai 1994 und in einer entsprechenden US-Patentanmeldung, Serial-No. 08/374,518 ein Verfahren vorgeschlagen, gemäß dem eine Tonkomponente, die hinsichtlich des Gehörsinns besonders wichtig ist, aus einem Spektrumssignal abgetrennt und gesondert von anderen Spektrumskomponenten codiert wird. Durch dieses Verfahren kann ein Adiosignal oder ein ähnliches bzw. dergleichen Signal bei einem hohen Kompressionsverhältnis effizient codiert werden, während hinsichtlich des Gehörsinns eine geringe Verschlechterung bewirkt wird.
In dem Fall, dass die oben erwähnten DFT- oder DCT-Transformationen als Verfahren zum Transformieren eines Wellenformsignals in ein Spektrum herangezogen werden, werden M unabhängige Echtzahldaten durch die Transformation mit einem Zeitblock erhalten, der M Abtastproben enthält. Um die Verbindungsverzerrung zwischen Zeitblöcken zu verringern, sind üblicherweise M1 Abtastproben zwischen zwei benachbarten Blöcken einander überlappt, und infolgedessen werden entspre chend der DFT- oder DCT-Transformation auf eine Mittelung hin M Echtzahldaten für (M-M1)-Abtastproben quantisiert und codiert.
In dem Fall, dass andererseits die oben erwähnte MDCT-Transformation als Verfahren zum Transformieren eines Wellenformsignals in ein Spektrum verwendet wird, werden M unabhängige Echtzahldaten von 2M Abtastproben erhalten, von denen N Abtastproben mit solchen jedes der gegenüberliegend benachbarten Zeitpunkten überlappt sind. Infolgedessen werden gemäß der MDCT-Transformation, wenn eine Mittelung erfolgt, M Echtzahldaten für M Abtastproben quantisiert und codiert. In einer Decodierungsvorrichtung wird eine inverse Transformation bezüglich jedes Blocks aus Codes ausgeführt, die unter Heranziehung der MDCT-Transformation auf diese Art und Weise erhalten sind, und die durch die inverse Transformation erhaltenen Wellenformelemente werden in einer sich überlagernden Beziehung zueinander addiert, um ein Wellenformsignal zurückzugewinnen.
Durch Vergrößern der Länge eines Zeitblocks zur Transformation wird generell die Frequenzauflösung von Spektren zunehmen, und die Energie wird auf eine bestimmte Spektrumskomponente konzentriert. Demgemäß kann in dem Fall, dass die MDCT-Transformation angewandt wird, bei der ein langer Block so transformiert wird, dass einzelne Hälften des betreffenden Blocks sich mit Blöcken auf den gegenüberliegenden Seiten überlappen, und bei dem die Anzahl der Spektrumssignale, die erhalten werden, nicht eine Zunahme in der Anzahl bezüglich der ursprünglichen Anzahl von Zeit-Abtastproben zeigt, eine Codierung mit einem höheren Wirkungsgrad ausgeführt werden als in dem Fall, dass die DFT- oder DCT-Transformation angewandt wird. Durch Bereitstellen einer hinreichend großen Überlappungslänge zwischen benachbarten Blöcken kann ferner die Zwischenblock-Verzerrung eines Wellenformsignals verringert werden.
Um eine tatsächliche Codefolge zu bilden, sollten die Quantisierungsgenauigkeitsinformation und die Normierungskoeffizienteninformation mit einer bestimmten Bitzahl für jedes Band codiert werden, bezüglich dessen eine Quantisierung und Normierung ausgeführt werden, und sodann sollte das normierte und quantisierte Spektrumssignal codiert werden.
Als Verfahren zum Codieren eines Spektrumssignals ist beispielsweise ein Verfahren bekannt, welches eine Codierung mit variabler Länge nutzt, wie die Huffman-Codierung. Die Huffman-Codierung ist beispielsweise angegeben von David A. Huffman in "A Method for the Construction of Minimum-Redundancy Codes", Proceedings of the I.R.E., Sep. 1952, Seiten 1098–1101.
Außerdem ist ein weiteres Verfahren bekannt, welches einen mehrdimensionalen variablen Längencode nutzt, durch den eine Vielzahl von Spektrumssignalen kollektiv durch einen einzelnen Code dargestellt wird. Generell nimmt bei einem Codierungsverfahren, welches einen mehrdimensionalen variablen Längencode anwendet, der Wirkungsgrad bei der Codierung hinsichtlich des Kompressionswirkungsgrades zu, wenn die Folgezahl des Codes zunimmt. Da der Umfang einer Codefolgentabelle progressiv zunimmt, wenn die Folgezahl steigt, führt das Verfahren im praktischen Gebrauch jedoch zu einem Problem. Tatsächlich wird eine optimale Folgezahl in Übereinstimmung mit einem Objekt ausgewählt, und zwar unter Berücksichtigung des Kompressionswirkungsgrades und des Umfangs der Codefolgentabelle.
Generell ist in einem akustischen Wellenformsignal die Energie häufig auf eine Grundfrequenzkomponente und auf Frequenzkomponenten konzentriert, die ganzzahlige Vielfache der Grundfrequenz sind, das sind Oberschwingungen bzw. harmonische Komponenten; da die Spektrumssignale um die Frequenzen herum sehr niedrige Pegel im Vergleich zu jenen der harmonischen Komponenten aufweisen, werden sie mit einer vergleichs weise hohen Wahrscheinlichkeit mit bzw. zu 0 quantisiert. Um solche Signale, wie oben beschrieben, effizient zu codieren, sollten Spektrumssignale, die zu 0 quantisiert werden, was mit einer hohen Wahrscheinlichkeit geschieht, mit einer möglichst geringen Informationsmenge codiert werden. In dem Fall, dass eindimensionale variable Längencodes verwendet werden, ist sogar dann, wenn jedes Spektrumssignal mit einem Bit codiert wird, welches die kleinste Codelänge darstellt, eine N-Bit-Information für N Spektren erforderlich. In dem Fall, dass ein mehrdimensionaler variabler Längencode mit der Folgezahl N verwendet wird, kann mit Rücksicht darauf, dass N Spektren mit einem Bit von der kleinsten Codelänge codiert werden können, eine effiziente Codierung für Signale ausgeführt werden, die solche Frequenzkomponenten, wie oben beschrieben, aufweisen.
Während sich eine Zunahme der Folgezahl der Codes bei einem Codierungsverfahren, welches einen mehrdimensionalen variablen Längencode verwendet, hinsichtlich des Kompressionswirkungsgrades erheblich vorteilhaft auswirkt, ist es indessen in dem Fall, dass eine praktische Anwendung berücksichtigt wird, unmöglich, die Folgezahl unbegrenzt zu erhöhen.
Normalerweise wird eine Codefolgentabelle für jede Quantisierungsgenauigkeitsinformation erstellt, die für das jeweilige Band festgelegt ist. In dem Fall, dass die Quantisierungsgenauigkeit niedrig ist, da die Anzahl der Werte der Spektrumssignale, die dargestellt werden können, gering ist, wird jedoch sogar in dem Fall, dass die Folgezahl erhöht ist, der Umfang der Codefolgentabelle nicht so sehr erhöht. In dem Fall, dass die Quantisierungsgenauigkeit hoch ist, ist jedoch auch die Anzahl der Werte der Spektrumssignale, die dargestellt werden können, ebenfalls hoch. Daher wird sogar dann, wenn die Folgezahl lediglich um eins erhöht wird, der Umfang der Codefolgentabelle merklich erweitert.
Dies wird unter Heranziehung eines konkreten Beispiels in weiteren Einzelheiten beschrieben. Nunmehr sei angenommen, dass ein Eingangssignal einer MDCT-Transformation unterzogen worden ist, um solche Spektren zu erhalten, wie sie in 1 dargestellt sind. In 1 sind die Absolutwerte der Spektren der MDCT-Transformation im Pegel in dB-Werte umgesetzt und auf der Ordinatenachse aufgetragen. Auf der Abszissenachse ist die Frequenz aufgetragen, und ein Eingangssignal wird unter Heranziehung einer bestimmten Zeitspanne als ein Block in 32 Spektrumssignale transformiert. Die Spektrumssignale werden in sechs codierte Einheiten aufgeteilt, die in 1 mit [1] bis [6] bezeichnet sind und die jeweils eine Vielzahl von Spektren enthalten; für jede codierte Einheit werden eine Normierung und eine Quantisierung ausgeführt.
Durch Verändern der Quantisierungsgenauigkeit für die jeweilige codierte Einheit in Abhängigkeit von einer Art der Verteilung der Frequenzkomponenten kann eine Codierung ausgeführt werden, die die Verschlechterung in der Tonqualität minimiert und die hinsichtlich des Gehörsinns effizient ist. Die für die jeweilige codierte Einheit benötigte Quantisierungsgenauigkeitsinformation kann durch Berechnen beispielsweise eines minimal hörbaren Pegels oder eines Maskierungspegels in einem Band, welches der jeweiligen codierten Einheit entspricht, auf der Grundlage eines Gehörsinnmodells erhalten werden. Jedes normierte und quantisierte Spektrumssignal wird in einen Code variabler Länge transformiert und zusammen mit der Quantisierungsgenauigkeitsinformation und der Normierungsinformation für die jeweilige codierte Einheit codiert.
Die Tabelle A veranschaulicht ein Darstellungsverfahren, wenn eine Quantisierungsgenauigkeitsinformation übertragen wird. In dem Fall, dass ein Quantisierungsgenauigkeits-Informationscode durch drei Bits dargestellt ist, können acht verschiedene Arten der Quantisierungsgenauigkeitsinformation festgelegt werden. Bei dem dargestellten Beispiel wird die Quantisierung mit einer der acht verschiedenen Schrittzahlen ausgeführt, nämlich mit einem Schritt, drei Schritten, fünf Schritten, sieben Schritten, 15 Schritten, 31 Schritten, 63 Schritten und 127 Schritten.
Hier bedeutet eine Quantisierung in einem Schritt, dass Spektrumssignale in der codierten Einheit alle zum Wert 0 quantisiert werden.
2 veranschaulicht in einer schematischen Darstellung ein Verfahren einer variablen Längencodierung, welches in üblicherweise ausgeführt worden ist. Spektrumssignale werden mit einer Quantisierungsgenauigkeitsinformation quantisiert, die für jede codierte Einheit festgelegt ist, um Quantisierungsspektren zu erhalten. Die Quantisierungsspektren werden dadurch in eine entsprechende Codefolge transformiert, dass auf eine solche Codefolgentabelle Bezug genommen wird, wie sie als Tabelle B dargestellt ist.
Gemäß 2 wird beispielsweise für die codierte Einheit [1] ein Code 011 als Quantisierungsgenauigkeitsinformation ausgewählt. Demgemäß wird eine Quantisierung mit sieben Schrittzahlen bzw. Schritten ausgeführt, wie dies aus der Tabelle B ersichtlich ist, und die Werte der quantisierten Spektrumssignale sind in der Reihenfolge von der Seite niedriger Frequenz her gegeben mit –1, 3, 0, 1. Hier ist darauf hinzuweisen, dass der Pegel des jeweiligen Spektrumssignals durch einen Absolutwert dargestellt ist.
Falls die Spektrumssignale in Codefolgen unter Heranziehung des Codefolgentabellenteiles der Tabelle B transformiert werden, in welchem der Quantisierungsgenauigkeits-Informationscode gegeben ist mit 011, dann werden die Zifferndaten von 101, 1110, 0 bzw. 100 erhalten. Damit weisen die Daten die Codelängen von 3, 4, 1 bzw. 3 auf.
Unterdessen wird für die codierte Einheit [2] ein anderer Code 010 als Quantisierungsgenauigkeitsinformation ausgewählt.
In diesem Fall wird eine Quantisierung mit fünf verschiedenen Schrittzahlen bzw. Schritten ausgeführt, wie dies aus der Tabelle B ersichtlich ist. Als Codefolgen, die hier verwendet werden können, weisen fünf verschiedene Zifferndaten von 111, 101, 0, 100 und 110 die geringste Wortlänge auf. Der Grund hierfür liegt darin, dass dann, wenn beispielsweise Codefolgen 10, 11, 0, 01 und 101 verwendet werden, sodann in dem Fall, dass 0101001 als Codefolge empfangen wird, nicht unterschieden werden kann, ob es sich dabei um 0, 101, 0, 01 oder um 01, 0, 10, 01 oder um 01, 01, 0, 01 handelt. Demgemäß muss bekannt gegeben werden, dass eine Beschränkung auf Codefolgen vorliegt, die genutzt werden können.
In dem Fall, dass der Quantisierungsgenauigkeits-Informationscode gegeben ist mit 010, sind die Werte der quantisierten Spektrumssignale in der Reihenfolge von der Seite der niedrigen Frequenz aus gegeben mit 0, –2, 1, 0. Wenn diese Signale in Codefolgen unter Heranziehung des Codefolgentabellenteiles der Tabelle B transformiert werden, gemäß dem der Quantisierungsgenauigkeits-Informationscode gegeben ist mit 010, dann sind die Spektrumssignalwerte gegeben mit 0, 111, 100, 0, und ihre Codelängen betragen 1, 3, 3 bzw. 1.
Wie aus der Tabelle B ersichtlich ist, werden die Codefolgen durch eine Zahl erstellt, die gleich der Quantisierungsschrittzahl ist. Demgemäß werden beispielsweise 127 verschiedene Codefolgen in dem Fall erstellt, dass der Quantisierungsgenauigkeits-Informationscode gegeben ist mit 111. Infolgedessen werden insgesamt 252 verschiedene Codefolgen erstellt.
In entsprechender Weise wird für die codierte Einheit [3] ein weiterer Code 001 als Quantisierungsgenauigkeitsinformation ausgewählt, und die Quantisierung wird mit drei verschiedenen Schrittzahlen bzw. Schritten ausgeführt. Damit sind die Quantisierungsspektren gegeben mit 0, –1, 0, 0; die Codefolgen sind gegeben mit 0, 11, 0, 0, und die Codelängen betragen 1, 2, 1, 1.
3 veranschaulicht ein zweidimensionales Verfahren zur variablen Längencodierung. Falls eine solche zweidimensionale Codefolgentabelle, wie sie aus der Tabelle C ersichtlich ist, als Codefolgentabelle für einen Fall verwendet wird, bei dem der Quantisierungsgenauigkeits-Informationscode gegeben ist mit 001, dann werden die Quantisierungsspektren der jeweiligen codierten Einheiten [1],[2] und [3], wie in 3 veranschaulicht, zwei zu zwei in einer Gruppe gesammelt, die in eine Codefolge transformiert wird. Demgemäß werden quantisierte Spektren 0, –1, 0, 0 der codierten Einheit [3] gesammelt, wie zu (0, –1) und (0, 0) und in zwei Codefolgen von 101, 0 transformiert.
In dem Fall, dass die quantisierten Spektren 0, –1, 0, 0 der codierten Einheit [3] in eindimensionale Codes variabler Länge codiert werden bzw. sind, wie dies in 2 veranschaulicht ist, beträgt die erforderliche Informationsmenge 1 + 2 + 1 + 1 = 5 Bits. Falls die Spektren demgegenüber in zweidimensionale Codes variabler Länge codiert werden bzw. sind, wie dies in 3 veranschaulicht ist, dann beträgt die Informationsmenge 3 + 1 = 4 Bits. Somit kann ersehen werden, dass die Heranziehung der zweidimensionalen variablen Längencodierung eine Codierung mit einer verringerten Informationsmenge ermöglicht.
Wie oben beschrieben, kann durch Sammeln von zwei quantisierten Spektren zu zweidimensionalen Daten und durch Codieren der zweidimensionalen Daten in einen Code mit variabler Länge entsprechend einer Codefolgentabelle die Codelänge im Vergleich zu dem Fall verringert werden, dass ein eindimensionaler Code variabler Länge verwendet wird.
Falls versucht wird, eine Vielzahl (N) von quantisierten Spektren in einer Gruppe zu sammeln, um N-dimensionale Daten zu erhalten und um die N-dimensionalen Daten in einen Code variabler Länge entsprechend einer Codefolgentabelle zu codieren, dann ist ferner ein sehr großer Umfang für die Codefolgentabelle erforderlich, was es schwierig macht, die Codierungsvorrichtung in praktischen Gebrauch zu bringen, und dies ist eine durch das Codierungsverfahren zu lösende Angelegenheit.
In dem Fall, dass beispielsweise die quantisierten Spektren der in 3 dargestellten codierten Einheit [3] unter Sammlung von vier Spektren in einer Gruppe zu einer Codefolge, 34 transformiert werden, heißt dies, dass 81 Codefolgen benötigt werden.
Eine Informationscodierungsvorrichtung, in der sämtliche Merkmale des Oberbegriffs des Anspruchs 1 enthalten sind, ist in WO 95/02240 A beschrieben.
Zusammenfassung der Erfindung
Eine Aufgabe der vorliegenden Erfindung besteht darin, eine Informationscodierungsvorrichtung, ein Informationscodierungsverfahren, eine Informationsdecodierungsvorrichtung, ein Informationsdecodierungsverfahren und einen Informationsaufzeichnungsträger bzw. -medium bereitzustellen, die eine Codierung/Decodierung mit einer vergleichsweise kleinen Codelänge ohne Steigerung des Umfangs einer Codefolgentabelle gestatten.
Gelöst wird diese Aufgabe bzw. erreicht dieses Ziel durch eine Informationscodierungsvorrichtung, ein Informationscodierungsverfahren, eine Informationsdecodierungsvorrichtung, ein Informationsdecodierungsverfahren und einen Informationsaufzeichnungsträger bzw. -medium gemäß den beigefügten unabhängigen Ansprüchen. Vorteilhafte Merkmale der vorliegenden Erfindung sind in den entsprechenden Unteransprüchen festgelegt.
Durch die vorliegende Erfindung kann eine Codierung mit einem hohen Wirkungsgrad ohne Steigerung des Umfangs einer Codefolgentabelle erreicht werden, und Codes mit einem hohen Kompressionswirkungsgrad können unter Heranziehung einer Codefolgentabelle eines kleinen Umfangs decodiert werden. Wenn ein Audiosignal unter Heranziehung eines Codierungsverfahrens entsprechend einer Quantisierungsgenauigkeitsinformation des Signals codiert wird, kann eine Codierung effizient ausgeführt werden. Auf dem Informationsaufzeichnungsträger bzw. -medium gemäß der vorliegenden Erfindung ist eine Information in einer höheren Dichte als jemals zuvor aufgezeichnet.
Die obigen sowie weitere Aufgaben, Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung und den beigefügten Ansprüchen in Verbindung mit den beigefügten Zeichnungen ersichtlich werden, in denen entsprechende Teile oder Elemente mit entsprechenden Bezugszeichen bezeichnet sind.
Kurze Beschreibung der Zeichnungen
1 veranschaulicht in einer schematischen Darstellung Spektren einer codierten Einheit.
2 veranschaulicht in einer schematischen Darstellung ein Codierungsverfahren gemäß einer verwandten Technik, bei dem eine variable Längencodierung angewandt ist.
3 veranschaulicht in einer schematischen Darstellung ein weiteres Codierungsverfahren gemäß der verwandten Technik, welches eine mehrdimensionale variable Längencodierung anwendet.
4 veranschaulicht in einem Blockdiagramm einen Aufbau einer Codierungsvorrichtung, bei der die vorliegende Erfindung angewandt ist.
5 veranschaulicht in einem Blockdiagramm einen Aufbau einer in 4 dargestellten Transformationsschaltung.
6 veranschaulicht in einem Blockdiagramm einen Aufbau einer in 4 dargestellten Signalkomponenten-Codierungsschaltung.
7 veranschaulicht in einem Blockdiagramm einen Aufbau einer Decodierungsvorrichtung, bei der die vorliegende Erfindung angewandt ist.
8 veranschaulicht in einem Blockdiagramm einen Aufbau einer in 7 dargestellten Invers-Transformationsschaltung.
9 veranschaulicht in einem Ablaufdiagramm ein Verfahren zur Codierung von Spektrumssignalen gemäß der vorliegenden Erfindung.
10 veranschaulicht in einem Ablaufdiagramm ein Verfahren zur Decodierung von Spektrumssignalen gemäß der vorliegenden Erfindung.
11 und 12 veranschaulichen in schematischen Diagrammen unterschiedliche Codierungsverfahren gemäß der vorliegenden Erfindung.
13 veranschaulicht in einer schematischen Darstellung ein Codierungsverfahren gemäß der verwandten Technik.
Tabelle A zeigt eine Tabelle zur Veranschaulichung eines Verfahrens zur Darstellung einer Quantisierungsgenauigkeitsinformation.
Tabelle B zeigt eine Tabelle zur Veranschaulichung eines Beispiels einer Codefolgetabelle.
Tabelle C zeigt eine Tabelle zur Veranschaulichung eines Beispiels einer mehrdimensionalen Codefolgentabelle gemäß der verwandten Technik.
Beschreibung der bevorzugten Ausführungsformen
Bevor bevorzugte Ausführungsformen der vorliegenden Erfindung beschrieben werden, werden zur Verdeutlichung der entsprechenden Beziehung zwischen den von der vorliegenden Erfindung, wie sie in den beigefügten Ansprüchen festgelegt ist, herangezogenen Einrichtungen und Elementen der Ausführungsformen der vorliegenden Erfindung verschiedene Aspekte der vorliegenden Erfindung mittels Bezugszeichen der Elemente der Ausführungsformen beschrieben, die den in den beigefügten Patentansprüchen festgelegten Elementen in Klammern hinzugefügt sind. Es versteht sich natürlich, dass dies nicht so zu verstehen ist, dass die Beschreibung die in den Patentansprüchen festgelegten Einrichtungen bzw. Mittel auf jene der Ausführungsformen beschränkt.
Eine Informationscodierungsvorrichtung umfasst eine Diskriminierungs- bzw. Unterscheidungseinrichtung (beispielsweise den Schritt S1 im Programm gemäß 9) zur Unterscheidung eines Informationsmusters jeder der Gruppen und eine Codierungseinrichtung (beispielsweise die Schritte S2, S3 und S4 in dem Programm gemäß 9) zur Codierung in dem Fall, dass die Information irgendeiner Gruppe eine Information eines bestimmten Musters ist, der Gruppe in dem kürzesten Code, während in dem Fall, dass die Information der Gruppe eine Information ist, die von der Information des bestimmten Musters verschieden ist, eine Codierung von Teilen der Information der Gruppe in entsprechende Codes erfolgt.
Eine Informationscodierungsvorrichtung enthält eine Aufteilungseinrichtung (beispielsweise die Vorwärts-Spektrums-Transformationsschaltungen 12 und 13 gemäß 5) zur Aufteilung von Signalen in bestimmte codierte Einheiten, eine Entscheidungseinrichtung (beispielsweise die Quantisierungsgenauigkeits-Bestimmungsschaltung 23 gemäß 6) zur Bestimmung der Quantisierungsgenauigkeitsinformation für jede der codierten Einheiten, eine Quantisierungseinrichtung (bei spielsweise die Quantisierungsschaltung 22 gemäß 6) zur Quantisierung der Signale auf die Quantisierungsgenauigkeitsinformation hin und eine Codierungseinrichtung (beispielsweise die Codefolgen-Erzeugungsschaltung 3 gemäß 1) zur Codierung des jeweiligen Signals unter Heranziehung eines Codierungsverfahrens entsprechend der Quantisierungsgenauigkeitsinformation.
Eine Informationsdecodierungsvorrichtung umfasst eine Diskriminierungs- bzw. Unterscheidungseinrichtung (beispielsweise den Schritt S11 in dem Programm gemäß 10) zur Unterscheidung, ob eine Vielzahl von Informationsteilen der jeweiligen Gruppe eine Information eines bestimmten Musters ist oder nicht, und eine Decodierungseinrichtung (beispielsweise die Schritte S12 und S13 in dem Programm gemäß 10 zum Decodieren, wenn die Vielzahl der Informationsteile irgendeiner Gruppe gegeben ist durch eine Information eines bestimmten Musters, von Codes der Gruppe in eine Vielzahl von Informationsteilen eines gleichen Wertes, während in dem Fall, dass die Vielzahl der Informationsteile irgendeiner Gruppe gegeben ist durch eine Information, die von der Information des bestimmten Musters verschieden ist, eine Decodierung von Codes der Gruppe in individuelle entsprechende Informationsteile erfolgt.
In 4 ist in einem Blockdiagramm ein Aufbau einer Codierungsvorrichtung für ein akustisches Wellenformsignal veranschaulicht, bei der die vorliegende Erfindung angewandt ist. Eine Signalwellenform 101, die der dargestellten Codierungsvorrichtung eingangsseitig zugeführt wird, wird durch eine Transformationsschaltung 1 in Signalfrequenzkomponenten 102 transformiert. Die Signalfrequenzkomponenten 102 werden durch eine Signalkomponenten-Codierungsschaltung 2 individuell codiert, und Codegruppen werden mittels einer Codefolgen-Erzeugungsschaltung 3 aus den Codes von der Signalkomponenten-Codierungsschaltung 2 erzeugt. Die Codefolgen werden durch bzw. über eine bestimmte Übertragungsleitung übertragen und/ oder auf einem Informationsaufzeichnungsträger bzw. -medium 4 aufgezeichnet.
5 veranschaulicht eine beispielhafte Form der Transformationsschaltung 1 gemäß 4. Gemäß 5 wird ein der Transformationsschaltung 1 eingangsseitig zugeführtes Signal 201 mittels eines Subbandfilters 11 in zwei Signalkomponenten 211 und 212 unterschiedlicher Bänder aufgeteilt. Die Signalkomponenten 211 und 212 werden durch Vorwärts-Spektrums-Transformationsschaltungen 12 und 13 in Spektrumssignalkomponenten 221 und 222 transformiert; die betreffenden Transformationsschaltungen führen eine Transformation, wie eine MDCT-Transformation aus. Die Bandbreiten der Signale 211 und 212 sind gleich einer Hälfte der Bandbreite des Signals 201 (d.h. die betreffenden Signale sind auf 1/2 in Bezug auf das Signal 201 ausgedünnt). Es sei darauf hingewiesen, dass das Signal 201 gemäß 5 der Signalwellenform 101 von 4 entspricht und dass die Signale 221 und 222 gemäß 5 dem Signal 102 gemäß 4 entsprechen.
Die Transformationsschaltung 1 kann verschiedene andere Formen aufweisen. So kann die Transformationsschaltung 1 beispielsweise ein Eingangssignal durch die MDCT-Transformation oder nicht durch die MDCT-Transformation, sondern durch die DFT- oder DCT-Transformation, die zur Transformation benutzt werden können, direkt in Spektrumssignale transformieren.
Obwohl es möglich ist, eine Verarbeitung lediglich dadurch vorzunehmen, dass ein Signal mittels eines Subbandfilters in Bandkomponenten unterteilt wird, ohne dass das Signal in Spektrumssignale transformiert wird, ist es mit Rücksicht darauf, dass das Verfahren gemäß der vorliegenden Erfindung insbesondere dort effektiv wirksam ist, wo Energie auf bzw. bei einer bestimmten Frequenz konzentriert ist, von Vorteil, ein Verfahren anzuwenden, bei dem ein Signal mittels der oben beschriebenen Spektrumstransformation in Frequenzkomponenten transformiert wird, wobei mittels der betreffenden Spektrums transformation eine große Anzahl von Frequenzkomponenten durch einen vergleichsweise geringen Rechenumfang erhalten werden kann.
6 veranschaulicht eine beispielhafte Form der Signalkomponenten-Codierungsschaltung 2 gemäß 4. Gemäß 6 wird jede Signalkomponente 301 zunächst für das jeweils bestimmte Band mittels einer Normierungsschaltung 21 normiert und dann als Signal 302 einer Quantisierungsschaltung 22 eingangsseitig zugeführt. Das Signal 302 wird dann mittels der Quantisierungsschaltung 22 entsprechend einem Quantisierungsgenauigkeitssignal 303 quantisiert, welches durch eine Quantisierungsgenauigkeits-Bestimmungsschaltung 23 berechnet ist, und das betreffende Signal wird als Signal 304 von der Quantisierungsschaltung 22 abgegeben. Während die Signalkomponente 301 gemäß 6 den Signalfrequenzkomponenten 102 gemäß 4 entspricht und während das Signal 304 gemäß 6 dem Signal 103 gemäß 4 entspricht, enthält das Signal 304 (103) zusätzlich zu einer quantisierten Signalkomponente eine Normierungskoeffizienteninformation und eine Quantisierungsgenauigkeitsinformation.
7 veranschaulicht in einem Blockdiagramm einen Aufbau einer Decodierungsvorrichtung gemäß der vorliegenden Erfindung; diese Decodierungsvorrichtung führt eine Decodierung und Abgabe eines akustischen Signals von einer Codefolge aus, die durch die in 4 dargestellte Codierungsvorrichtung erzeugt wird. Gemäß 7 wird in der dargestellten Decodierungsvorrichtung eine zu dieser übertragene oder von dem Informationsaufzeichnungsträger bzw. -medium 4 wiedergegebene Codefolge 401 einer Codefolgen-Zerlegungsschaltung 41 eingangsseitig zugeführt, durch die Codes 402 einzelner Signalkomponenten extrahiert werden. Die Codes 402 werden mittels einer Signalkomponenten-Decodierungsschaltung 42 in Signalkomponenten 403 decodiert, und aus den Signalkomponenten 403 wird von einer Invers-Transformationsschaltung 43 ein akustisches Wellenformsignal 404 erzeugt und abgegeben.
8 veranschaulicht eine beispielhafte Form der Invers-Transformationsschaltung 43 gemäß 7. Gemäß 8 entspricht die dargestellte Invers-Transformationsschaltung 43 der Form der in 5 dargestellten Transformationsschaltung 1. Insbesondere werden Signale 501 und 502 Invers-Spektrums-Transformationsschaltungen 51 und 52 eingangsseitig zugeführt, durch die Signale 511 bzw. 512 unterschiedlicher Bänder erhalten werden. Die Signale 511 und 512 werden durch ein Bandzusammensetzungs- bzw. Bandbildungsfilter 53 gebildet und von dem Bandbildungsfilter 53 als Signal 521 abgegeben. Die Signale 501 und 502 gemäß 8 entsprechen den Signalkomponenten 403 gemäß 7, und das Signal 521 gemäß 8 entspricht dem akustischen Wellenformsignal 404 gemäß 7.
Anschließend wird die Arbeitsweise der in 4 bis 6 dargestellten Codierungsvorrichtung beschrieben. Zunächst wird auf 5 Bezug genommen, gemäß der ein akustisches Wellenformsignal 201 (101 in 4) dem Subbandfilter 11 der Transformationsschaltung 1 eingangsseitig zugeführt und durch das Subbandfilter 11 in eine Signalkomponente 211 einer vergleichsweise niedrigen Frequenz sowie in eine weitere Signalkomponente 212 einer vergleichsweise hohen Frequenz aufgeteilt wird. Die Signalkomponente 211 der vergleichsweise niedrigen Frequenz wird der Vorwärts-Spektrums-Transformationsschaltung 12 eingangsseitig zugeführt und durch diese Vorwärts-Spektrums-Transformationsschaltung 12 in eine Spektrumssignalkomponente 221 transformiert. In entsprechender Weise wird die Signalkomponente 212 der vergleichsweise hohen Frequenz der Vorwärts-Spektrums-Transformationsschaltung 13 eingangsseitig zugeführt und durch diese Vorwärts-Spektrums-Transformationsschaltung 13 in eine Spektrumssignalkomponente 222 transformiert und von der betreffenden Transformationsschaltung abgegeben.
Unter Bezugnahme auch auf 1 sei angemerkt, dass die Vorwärts-Spektrums-Transformationsschaltung 12 Spektrumssignale einer vergleichsweise niedrigen Frequenz in Einheiten transformiert, um codierte Einheiten [1] bis [3] zu erzeugen. Unterdessen transformiert die Vorwärts-Spektrums-Transformationsschaltung 13 Spektrumssignale einer vergleichsweise hohen Frequenz in Einheiten, um codierte Einheiten [4] bis [6] zu erzeugen.
Jede der von den Vorwärts-Spektrums-Transformationsschaltungen 12 und 13 abgegebenen Spektrumssignalkomponenten 221 und 222 (102) wird der Normierungsschaltung 21 und der Quantisierungsgenauigkeits-Bestimmungsschaltung 23 der Signalkomponenten-Codierungsschaltung 2 eingangsseitig zugeführt. Die Normierungsschaltung 21 teilt die Werte der Vielzahl der Spektrumssignalkomponenten in jeder codierten Einheit durch einen Maximalwert aus den Werten der Spektrumssignalkomponenten, um die Spektrumssignalkomponenten zu normieren. Sodann werden die durch die Normierung erhaltenen Normierungskoeffizienten 302 an die Quantisierungsschaltung 22 abgegeben.
Die Quantisierungsgenauigkeits-Bestimmungsschaltung 23 berechnet einen minimal hörbaren Pegel oder einen Maskierungspegel für ein der jeweiligen codierten Einheit entsprechendes Band, um die Quantisierungsgenauigkeit der dort in Einheiten einer codierten Einheit eingangsseitig zugeführten Spektrumssignalkomponenten zu bestimmen. Die Quantisierungsschaltung 22 quantisiert die Normierungskoeffizienten 302, die ihr von der Normierungsschaltung 21 zugeführt sind, mit dem Quantisierungsgenauigkeitssignal 303, welches ihr von der Quantisierungsgenauigkeits-Bestimmungsschaltung 23 zugeführt ist, um ein Quantisierungssignal 304 (103) zu erhalten, und sie gibt das Quantisierungssignal 304 (103) an die Codefolgen-Erzeugungsschaltung 3 ab. Die Codefolgen-Erzeugungsschaltung 3 transformiert die quantisierten Spektrumssignale in Codefolgen entsprechend der in dem Ablaufdiagramm gemäß 9 veranschaulichten Verarbeitung.
Gemäß 9 bezeichnet ein Bezugszeichen QSP(i) die quantisierten Spektrumssignale, und N stellt die Anzahl der zu einem Zeitpunkt zu codierenden Spektrumssignale dar. Es kann in Betracht gezogen werden, dass N ein Wert ist, der der Folgezahl einer variablen Längencodierung entspricht.
Zunächst werden beim Schritt S1 die Werte der N quantisierten Spektrumssignale QSP(M) bis QSP(M + N – 1) überprüft; wenn alle gleich 0 sind, geht die Steuerfolge weiter zum Schritt S2, bei dem 0 als Codefolge der N Spektren codiert wird. Falls jedoch irgendein von 0 verschiedener Wert aus bzw. bei irgendeinem der N Spektrumssignale ermittelt wird, geht die Steuerfolge sodann weiter zum Schritt S3, bei dem 1 als Codefolge codiert wird. Danach geht die Steuerfolge weiter zum Schritt S4, bei dem die quantisierten Spektrumssignale QSP(M) bis QSP(M + N – 1) aufeinanderfolgend codiert werden. Die Codierung der quantisierten Spektrumssignale QSP(M) bis QSP(M + N – 1) wird in ähnlicher bzw. entsprechender Weise ausgeführt wie bei der eindimensionalen Codierung gemäß der verwandten Technik.
Anschließend wird die Arbeitsweise der in 7 und 8 dargestellten Decodierungsvorrichtung beschrieben. Ein der Decodierungsvorrichtung von der in 4 dargestellten Codierungsvorrichtung übertragenes oder von dem Informationsaufzeichnungsträger bzw. -medium 4 wiedergegebenes Signal 401 wird der Codefolgen-Zerlegungsschaltung 41 eingangsseitig zugeführt. Die Codefolgen-Zerlegungsschaltung 41 führt eine Codefolgen-Zerlegungsverarbeitung in einer solchen Weise durch, wie sie in dem Ablaufdiagramm gemäß 10 veranschaulicht ist.
Gemäß 10 bezeichnet in entsprechender Weise wie bei der in 9 dargestellte Codierungsverarbeitung das Bezugszeichen QSP(i) die quantisierten Spektrumssignale, und N repräsentiert die Anzahl der zu einem Zeitpunkt zu decodierenden Spektrumssignale. Zunächst wird beim Schritt S11 das erste Bit der codierten Codefolge gelesen; falls der so gelesene Code gegeben ist mit 0, geht die Steuerfolge sodann weiter zum Schritt S12, bei dem die Werte der quantisierten Spektrumssignale QSP(M) bis QSP(M + N – 1) alle auf 0 gesetzt werden. Wenn demgegenüber beim Schritt S11 bestimmt wird, dass das erste Bit der codierten Codefolge nicht 0 ist, d.h. dann, wenn das erste Bit gegeben ist mit 1, geht die Steuerfolge sodann weiter zum Schritt S13, bei dem die quantisierten Spektrumssignale QSP(M) bis QSP(M + N – 1) der Codefolge individuell und aufeinanderfolgend decodiert werden, und zwar beginnend mit dem zweiten Bit der Codefolge. Die Decodierung der quantisierten Spektrumssignale QSP(M) bis QSP(M + N – 1) wird in einer ähnlichen bzw. entsprechenden Weise ausgeführt wie bei der eindimensionalen Decodierung gemäß der verwandten Technik.
Die auf diese Weise durch die Zerlegung mittels der Codefolgen-Zerlegungsschaltung 41 erhaltenen Signale 402 werden der Signalkomponenten-Decodierungsschaltung 42 eingangsseitig zugeführt und durch diese decodiert. Die Signalkomponenten-Decodierungsschaltung 42 führt eine inverse Verarbeitung zu jener der in 6 dargestellten Signalkomponenten-Codierungsschaltung 2 aus.
Sodann wird eine der von der Signalkomponenten-Decodierungsschaltung 42 abgegebenen Signalkomponenten 403, die eine vergleichsweise niedrige Frequenz besitzt, das ist die Spektrumssignalkomponente 501, der Invers-Spektrums-Transformationsschaltung 51 eingangsseitig zugeführt, während die andere Signalkomponente der betreffenden Signalkomponenten 403, die eine vergleichsweise hohe Frequenz besitzt, das ist die Spektrumssignalkomponente 502, der Invers-Spektrums-Transformationsschaltung 52 eingangsseitig zugeführt wird. Die Invers-Spektrumstransformationsschaltungen 51 und 52 transformieren die ihnen eingangsseitig zugeführten Spektrumssignalkomponenten 501 bzw. 502 zu akustischen Signalen 511 bzw. 512 auf der Zeitbasis, und sie gegen die akustischen Signale 511 bzw. 512 an das Bandzusammensetzungsfilter 53 ab. Das Bandzusammensetzungsfilter 53 setzt das akustische Signal 511 einer vergleichsweise niedrigen Frequenz und das akustische Signal 512 einer vergleichsweise hohen Frequenz zu einem zusammengesetzten akustischen Signal 521 (404) zusammen und gibt das akustische Signal 521 (404) ab.
11 veranschaulicht in einer schematischen Darstellung ein detailliertes Beispiel auf eine Codierung von Spektrumssignalen gemäß der vorliegenden Erfindung hin. Insbesondere veranschaulicht 11 eine Art und Weise, in der Spektrumssignale in einer codierten Einheit codiert werden bzw. sind. Bei der in 11 dargestellten Codierungsweise werden jeweils zwei benachbarte Spektrumssignale zu einer Gruppe gesammelt, und es wird eine Codierung für die Gruppe ausgeführt. Wie aus 11 ersehen werden kann, werden dann, wenn die durch Quantisieren von zwei benachbarten Spektrumssignalen erhaltenen Werte alle gleich 0 sind (wenn beim Schritt S1 die Bestimmung JA lautet), die beiden Spektrumssignale zu einer Codegruppe von 0 (Schritt S2) codiert; in jedem anderen Fall (wenn die Bestimmung beim Schritt S1 NEIN lautet), beispielsweise dann, wenn die durch Quantisieren von zwei Spektrumssignalen erhaltenen Werte gegeben sind mit –2 und 3, werden die beiden Spektrumssignale sodann zu einer anderen Codefolge von 1 (Schritt S3) transformiert. Sodann werden die Quantisierungswerte –2 und 3 aufeinanderfolgend zu 1101 bzw. 1110 codiert. Dazu wird beispielsweise der Codefolgen-Tabellenteil der oben beschriebenen Tabelle B herangezogen. Es wird berücksichtigt, dass dies unter Heranziehung des eindimensionalen Codefolgen-Tabellenteiles der Tabelle B eine zweidimensionale variable Längencodierung künstlich realisiert. Wie in 11 veranschaulicht, beträgt die Codelänge der codierten Einheit sodann 12 (= 1 + 1 + 4 + 4 + 1 + 1).
12 veranschaulicht in entsprechender Weise in einer schematischen Darstellung eine Art und Weise, in der vier Spektren kollektiv codiert werden. Außerdem ist in diesem Fall berücksichtigt, dass unter Heranziehung des eindimensionalen Codefolgen-Tabellenteiles eine vierdimensionale variable Längencodierung künstlich realisiert wird.
Bei der vorliegenden Codierung werden insbesondere vier Quantisierungsspektren 0, 0, –2, 3 entsprechend dem Codefolgen-Tabellenteil der Tabelle B für den Quantisierungsgenauigkeits-Informationscode von 011 (Schritt S4) zu 0, 0, 1101, 1110 individuell quantisiert. Sodann wird zum Zwecke eine Identifizierung dem Anfang jener Codefolgen (Schritt S3) eine 1 hinzugefügt. Ferner werden vier aufeinanderfolgende Quantisierungsspektren 0, 0, 0, 0 zu 0 codiert (Schritt S2). Demgemäß beträgt die Codelänge der codierten Einheit in diesem Fall 12 (= 1 + 1 + 1 + 4 + 4 + 1).
Bei den in 11 und 12 dargestellten Arten der Codierung werden Spektrumssignale in einer codierten Einheit mit einer Informationsmenge von 12 Bits codiert. Vergleichshalber ist hier eine Art und Weise der Codierung, bei der Spektrumssignale nach einem Verfahren codiert werden, welches die eindimensionale variable Längencodierung gemäß der verwandten Technik anwendet (ein Codefolgen-Tabellenteil der Tabelle B), in 13 veranschaulicht. Wie aus 13 ersichtlich ist, beträgt die Informationsmenge in diesem Fall 14 Bits. Demgemäß kann ersehen werden, dass die Verfahren eine Codierung mit einer geringeren Informationsmenge erzielen können.
Zum Vergleich wird hier der Umfang des Codefolgen-Tabellenteiles, in welchem der Quantisierungsgenauigkeits-Informationscode gemäß 13 gegeben ist mit 011, wenn ein Codefolgen-Tabellenteil, der übermäßig bei der zweidimensionalen und vierdimensionalen variablen Längencodierung angewandt wird, nach dem Verfahren gemäß der verwandten Technik erzeugt wird, berechnet. Die Berechnung belegt, dass beim Umfang von sieben Wörtern, bei dem die eindimensionale variable Längencodierung angewandt ist, im Falle der Anwendung der zweidimensionalen variablen Längencodierung ein Codefolgen-Tabel lenteil von 49 Wörtern erforderlich ist und dass bei Anwendung der vierdimensionalen variablen Codierung ein Codefolgen-Tabellenteil von 2401 Wörtern benötigt wird.
Generell ist bei einem akustischen Wellenformsignal in den meisten Fällen die Energie bei einer Grundfrequenz und bei Frequenzkomponenten konzentriert, die gleich ganzzahligen Vielfachen der Grundfrequenz sind, das sind Harmonische bzw. Oberwellenkomponenten; sogar dann, wenn Spektrumssignale von Frequenzkomponenten, die von der Grundfrequenz oder den Oberwellenkomponenten verschieden sind, quantisiert werden, sind die erhaltenen Werte in den meisten Fällen gleich Null. Wenn die Grundfrequenz zunimmt, da das Intervall zwischen Oberwellenkomponenten zunimmt, steigt die Wahrscheinlichkeit für das Auftreten von Quantisierungsspektren von 0. Da ein ausreichender Störabstand im bzw. für den Gehörsinn dann nicht gewährleistet werden kann, wenn die Quantisierungsgenauigkeit für Signale mit solchen Frequenzkomponenten nicht erhöht wird, um sie zu quantisieren, wird ferner eine beachtlich große Informationsmenge verbraucht. Insbesondere in einem Band, in welchem die Breite einer codierten Einheit groß ist, ist die verbrauchte Informationsmenge groß.
Um eine Codierung für solche Signale effizient auszuführen, werden somit Spektrumssignale, die zu 0 quantisiert sind, mit einer verringerten Informationsmenge codiert. Wie oben beschrieben, realisiert das Verfahren gemäß der vorliegenden Erfindung eine effiziente Codierung ohne Steigerung des Umfangs einer Codefolgentabelle.
Während oben die Ausführungsform beschrieben worden ist, bei der mittels eines Spektrumsfilters gefilterte und mittels einer MDCT-Transformation einer Spektrumstransformation unterzogene Signale von der Bandaufteilungsschaltung abgegeben werden und bei der durch eine inverse MDCT-Transformation (IMDCT) einer inversen Spektrumstransformation unterzogene und mittels eines Bandzerlegungsfilters gefilterte Signale von der Bandzerlegungsschaltung abgegeben werden, ist es selbstverständlich, dass die MDCT-Transformation oder die IMDCT-Transformation direkt ohne Verwendung eines Subbandfilters oder eines Bandzusammensetzungsfilters ausgeführt werden können. Ferner ist die Art der Spektrumstransformation nicht auf die MDCT-Transformation beschränkt; vielmehr kann statt dessen die DFT-Transformation, die DCT-Transformation oder irgendeine andere Transformation angewandt werden.
Ferner braucht die Spektrumstransformation nicht notwendigerweise angewandt zu werden; vielmehr können eine Bandaufteilung oder eine Bandzusammensetzung lediglich mittels eines Subbandfilters oder eines Bandzusammensetzungsfilters ausgeführt werden. In diesem Fall werden ein Band, welches durch Aufteilung mittels eines Filters erhalten wird, oder eine Vielzahl derartiger Aufteilungsbänder als eine codierte Einheit verarbeitet. Durch Aufbau einer codierten Einheit, wie er zuvor in Verbindung mit der Ausführungsform beschrieben worden ist, nach Ausführen einer Spektrumstransformation, wie der MDCT-Transformation, zur Transformation eines akustischen Wellenformsignals in eine große Anzahl von Spektrumssignalen kann das Verfahren gemäß der vorliegenden Erfindung indessen effizient angewandt werden.
Während oben die Verarbeitung eines akustischen Wellenformsignals beschrieben worden ist, kann das Verfahren gemäß der vorliegenden Erfindung ferner bei verschiedenen Arten von Signalen angewandt werden, und sie kann beispielsweise auch bei einem Videosignal angewandt werden. Da die vorliegende Erfindung eine Charakteristik eines akustischen Wellenformsignals ausnutzt, um eine effiziente Codierung zu realisieren, bei der viele Spektrumssignale, die zu 0 quantisiert werden, involviert sind, ist das Verfahren gemäß der vorliegenden Erfindung in dem Fall effektiv, in dem es für ein akustisches Wellenformsignal angewandt wird.
Ferner kann das Verfahren gemäß der vorliegenden Erfindung in Kombination mit dem Verfahren der verwandten Technik benutzt werden, welches eine variable Längencodierung anwendet. So ist es beispielsweise effektiver, unter Berücksichtigung des Umfangs der Codefolgentabelle in dem Fall, dass die Quantisierungsgenauigkeit gering ist, d.h. in dem Fall, dass die Quantisierungsschrittzahl gering ist, eine Codierung nach dem Verfahren gemäß der verwandten Technik unter Heranziehung einer zweidimensionalen oder vierdimensionalen Codefolgentabelle auszuführen, jedoch in dem Fall, dass die Quantisierungsgenauigkeit hoch ist, d.h. dann, wenn die Quantisierungsschrittgröße groß ist, eine Codierung unter Heranziehung des Verfahrens gemäß der vorliegenden Erfindung auszuführen.

Claims

Informationscodierungsvorrichtung zum Codieren einer Vielzahl von in Dateneinheiten aufgeteilten Daten in Zifferndaten, mit einer Detektiereinrichtung (3, S1) zum Ermitteln, ob Daten in einer Dateneinheit mit einem bestimmten Muster übereinstimmen, und mit einer Codierungseinrichtung (3, S2...S4), die in dem Fall, dass die Detektiereinrichtung (3, S1) keine Übereinstimmung ermittelt, die Daten in eine Vielzahl von entsprechenden Codes (S3, S4) codiert, dadurch gekennzeichnet, dass die genannte Detektiereinrichtung (3, S1) eine Einrichtung zum Aufteilen der genannten Dateneinheit in Gruppen umfasst, deren jede eine Vielzahl von Datenelementen aufweist, wobei die betreffende Detektiereinrichtung (3, S1) imstande ist zu ermitteln, ob eine Gruppe mit einem bestimmten Muster von Datenelementen übereinstimmt, und dass die genannte Codierungseinrichtung (3, S2...S4), in dem Fall, dass die Detektiereinrichtung (3, S1) eine Übereinstimmung ermittelt, die Gruppe in einen kürzesten Code (S2) zu codieren imstande ist, jedoch in dem Fall, dass die Detektiereinrichtung (3, S1) keine Übereinstimmung feststellt, jedes der Datenelemente der Gruppe aufeinanderfolgend und gesondert in einen entsprechenden Code (S3, S4) zu codieren imstande ist, wobei ein Bit eines bestimmten Wertes der in eine Vielzahl von entsprechenden Codes codierten Gruppe hinzuaddiert wird.
Informationscodierungsvorrichtung nach Anspruch 1, wobei in dem bestimmten Muster sämtliche Datenelemente Datenelemente 0 sind.
Informationscodierungsvorrichtung nach Anspruch 1 oder 2, wobei die genannte Codierungseinrichtung (3, S2...S4), in dem Fall, dass die Detektiereinrichtung (3, S1) eine Übereinstimmung ermittelt, die Gruppe in einen Code von einem Bit zu codieren imstande ist, jedoch in dem Fall, das die Detektiereinrichtung (3, S1) keine Übereinstimmung ermittelt, die Gruppe in eine Codefolge zu codieren imstande ist, welche eine Kombination aus dem Code von einem Bit und einer Codefolge entsprechend den Datenelementen der Gruppe enthält.
Informationscodierungsvorrichtung nach einem der Ansprüche 1 bis 3, wobei der kürzeste Code eine 0 ist und wobei das Bit, welches angibt, dass die Gruppe von Daten in die genannte Vielzahl von entsprechenden Codes codiert ist, 1 ist.
Informationscodierungsvorrichtung nach einem der Ansprüche 1 bis 4, wobei die genannte Vielzahl von entsprechenden Codes eine Codefolge variabler Länge ist.
Informationscodierungsvorrichtung nach einem der Ansprüche 1 bis 5, wobei die in einer Vielzahl vorgesehenen Daten Werte, die durch Quantisieren eines akustischen Wellenformsignals erhalten werden, oder Werte sind, die durch Quantisieren von Spektrumssignalen erhalten werden, welche durch Transformieren eines akustischen Wellenformsignals auf der Frequenzbasis erhalten werden.
Informationscodierungsvorrichtung nach einem der Ansprüche 1 bis 6, ferner umfassend: eine Aufteilungseinrichtung (11, 12) zum Aufteilen eines Signals in Codeeinheiten, eine Bestimmungseinrichtung (23) zum Bestimmen einer Quantisierungsgenauigkeitsinformation für jede der genannten Codeeinheiten, eine Quantisierungseinrichtung (22) zum Quantisieren des in die genannten Codeeinheiten aufgeteilten Signals auf die Quantisierungsgenauigkeitsinformation hin zur Bildung der genannten Dateneinheiten, wobei die genannte Codierungseinrichtung (3, S2...S4) imstande ist, die Gruppe in die genannte Vielzahl von entsprechenden Codes (S3, S4) auf der Grundlage der Datenelemente der betreffenden Gruppe und der Quantisierungsgenauigkeitsinformation zu codieren, wenn die Detektiereinrichtung (3, S1) keine Übereinstimmung feststellt.
Informationscodierungsverfahren zum Codieren einer Vielzahl von in Dateneinheiten aufgeteilten Daten in Zifferndaten, umfassend die Schritte des Detektierens (S1), ob Daten in einer Dateneinheit mit einem bestimmten Muster übereinstimmen, und des Codierens (S2...S4) der Daten in eine Vielzahl von entsprechenden Codes (S3, S4), wenn eine Nichtübereinstimmung festgestellt wird (S1), dadurch gekennzeichnet, dass die genannte Dateneinheit in Gruppen aufgeteilt wird, deren jede eine Vielzahl von Datenelementen aufweist, wobei bei dem betreffenden Detektierschritt (S1) festgestellt wird, ob eine Gruppe mit einem bestimmten Muster von Datenelementen übereinstimmt, und dass bei dem genannten Codierungsschritt (S2...S4) in dem Fall, dass eine Übereinstimmung festgestellt wird, die Gruppe in einen kürzesten Code (S2) codiert wird, dass jedoch dann, wenn eine Nichtübereinstimmung festgestellt (S1) wird, jedes der Datenelemente der Gruppe aufeinanderfolgend und gesondert in einen entsprechenden Code (S3, S4) codiert wird, wobei ein Bit eines bestimmten Wertes der in eine Vielzahl von entsprechenden Codes codierten Gruppe hinzuaddiert wird.
Informationscodierungsverfahren nach Anspruch 8, wobei in dem bestimmten Muster sämtliche Datenelemente Datenelemente 0 sind.
Informationscodierungsverfahren nach Anspruch 8 oder 9, wobei bei dem genannten Codierungsschritt (S2...S4) in dem Fall, dass eine Übereinstimmung festgestellt wird (S1), die Gruppe in einen Code von einem Bit codiert wird, wobei jedoch dann, wenn eine Nichtübereinstimmung festgestellt wird (S1), die Gruppe in eine Codefolge codiert wird, welche eine Kombination des Codes von einem Bit und einer Codefolge entsprechend den Datenelementen der Gruppe enthält.
Informationscodierungsverfahren nach einem der Ansprüche 8 bis 10, wobei der kürzeste Code eine 0 ist und wobei das Bit, welches angibt, dass die Gruppe von Daten in die genannte Vielzahl von entsprechenden Codes codiert ist, 1 ist.
Informationscodierungsverfahren nach einem der Ansprüche 8 bis 11, wobei die in einer Vielzahl vorgesehenen Daten, die in Einheiten aufgeteilt sind, Werte, welche durch Quantisieren eines akustischen Wellenformsignals erhalten werden, oder Werte sind, die durch Quantisieren von Spektrumssignalen erhalten werden, welche durch Transformieren eines akustischen Wellenformsignals auf der Frequenzbasis erhalten werden.
Informationscodierungsverfahren nach einem der Ansprüche 8 bis 12, ferner umfassend die Schritte: Aufteilen (11, 12) eines Eingangssignals in Codeeinheiten, Bestimmen (23) einer Quantisierungsgenauigkeitsinformation für jede der betreffenden Codeeinheiten, Quantisieren (22) des in die genannten Codeeinheiten aufgeteilten Signals auf die Quantisierungsgenauigkeitsinformation hin zur Bildung der genannten Dateneinheiten, wobei bei dem genannten Codierungsschritt (S2...S4) die Gruppe in die genannte Vielzahl von entsprechenden Codes (S3, S4) auf der Grundlage der Datenelemente der genannten Gruppe und der Quantisierungsgenauigkeitsinformation codiert wird, wenn bei dem genannten Detektierschritt (S1) eine Nichtübereinstimmung ermittelt wird.
Informationsdecodierungsvorrichtung zum Decodieren von Codes von Zifferndaten in Datengruppen, die jeweils eine bestimmte Anzahl von Datenelementen aufweisen, umfassend: eine Einrichtung (41, S11) zum Lesen eines ersten Bits und eine Einrichtung (42) zum Decodieren, wobei dann, wenn das betreffende erste eine Bit gleich einem bestimmten Wert (S11) ist, sämtliche der genannten bestimmten Anzahl von Datenelementen auf dieselben decodierten Daten (S12) gesetzt werden, wobei jedoch in dem Fall, dass das betreffende erste eine Bit nicht gleich einem bestimmten Wert (S11) ist, ein aufeinanderfolgendes und gesondertes Decodieren einer bestimmten Anzahl von aufeinanderfolgenden Codes in entsprechende Datenelemente erfolgt (S13).
Informationsdecodierungsvorrichtung nach Anspruch 14, wobei in der genannten Gruppe von bestimmten Datenelementen sämtliche Datenelemente auf 0 gesetzt sind und wobei der genannte bestimmte Wert des betreffenden ersten einen Bits 0 ist.
Informationsdecodierungsverfahren zum Decodieren von Codes von Zifferndaten in Datengruppen, deren jede eine bestimmte Anzahl von Datenelementen enthält, umfassend die Schritte: Lesen (41, S11) eines ersten Bits und Decodieren (42), wobei dann, wenn das betreffende erste eine Bit gleich einem bestimmten Wert (S11) ist, sämtliche der betreffenden bestimmten Anzahl von Datenelementen auf dieselben decodierten Daten (S12) gesetzt werden, wobei jedoch in dem Fall, dass das betreffende erste eine Bit nicht gleich einem bestimmten Wert (S11) ist, ein aufeinanderfolgendes und gesondertes Decodieren einer bestimmten Anzahl von aufeinanderfolgenden Codes in entsprechende Datenelemente erfolgt (S13).
Informationsdecodierungsverfahren nach Anspruch 16, wobei in der genannten Gruppe von bestimmten Datenelementen sämtliche Datenelemente auf 0 gesetzt werden und wobei der genannte bestimmte Wert des betreffenden ersten einen Bits 0 ist.
Informationsaufzeichnungsträger, auf dem Daten aufgezeichnet sind, die durch eine Informationscodierungsvorrichtung codiert sind, welche das Verfahren nach einem der Ansprüche 8 bis 13 ausführt.