-
Vorrichtung und Verfahren zur Signalcodierung
und Signaldecodierung sowie Aufzeichnungsträger, auf dem mit der Vorrichtung
oder nach dem Verfahren codierte Signale aufgezeichnet sind
-
Technisches Gebiet
-
Die Erfindung bezieht auf eine Signalcodiervorrichtung,
bei der eine solche Codierung von Informationen, wie von digitalen
Signaldaten, etc. zur effizienten Codierung eines digitalen Signals,
wie von eingangsseitigen digitalen Daten, etc. zur Übertragung
oder Aufzeichnung des codierten digitalen Signals angewandt wird,
sowie auf einen Signalaufzeichnungsträger, der derart geeignet ist,
dass durch eine derartige Signalcodierungsvorrichtung codierte Signale
aufgezeichnet werden, und auf eine Signaldecodierungsvorrichtung,
bei der eine derartige Decodierung von Informationen, wie von digitalen
Daten, etc. zur Decodierung eines codierten Signals, das von einem
Aufzeichnungsträger,
wie oben erwähnt,
wiedergegeben oder von einer Signalcodiervorrichtung, wie oben erwähnt, übertragen
wird, angewandt wird, um ein Wiedergabesignal zu erhalten.
-
Hintergrund-Technik
-
Bisher gibt es verschiedene effiziente
Codierverfahren bzw. -techniken für Audiosignale oder Sprachsignale,
etc.. Als repräsentativ
hierfür
kann eine Bandaufteilungs-Codierung aufgeführt werden (Subbandcodierung
(SBC)), die ein nicht blockbildendes Frequenzbandunterteilungssystem
darstellt, mit dem ein Audiosignal, etc. auf der Zeitbasis in Signalkomponenten
in einer Vielzahl von Frequenzbändern,
zu einer jeweils bestimmten Einheitszeit aufgeteilt wird, ohne damit
eine Blockbildung auszuführen, um
die betreffenden Signale zu codieren, das ist eine sogenannte Transformationscodierung,
die das Blockbildungs-Frequenzband-Unterteilungssystem darstellt,
um ein Signal auf der Zeitbasis in Blöcke zur jeweiligen bestimmten
Einheitszeit zu unterteilen, um die betreffenden Signale auf der
Zeitbasis in Signale auf der Frequenzbasis mit bzw. nach jeweils
entsprechenden Blöcken
zu transformieren (Spektrums-Transformationsverarbeitung),
um die auf diese Weise transformierten Signale in Signalkomponenten
in einer Vielzahl von Frequenzbändern
aufzuteilen, damit diese in den jeweiligen entsprechenden Frequenzbändern codiert
werden, und dergleichen. Darüber
hinaus ist auch schon ein effizientes Codierverfahren vorgeschlagen
worden, bei dem die Bandunterteilungs-Codierung und die Transformationscodierung,
wie oben beschrieben, kombiniert sind. In diesem Falle wird beispielsweise
ein Signal auf der Zeitbasis in Signale in einer Vielzahl von Bändern durch
die oben erwähnte
Bandunterteilungs-Codierung aufgeteilt, um danach eine Spektrums-Transformation
der Signale der jeweiligen entsprechenden Bänder in Signale auf der Frequenzbasis
vorzunehmen, um damit die Codierung in die spektrums-transformierten
Signale der jeweiligen entsprechenden Bänder auszuführen.
-
Hier gibt es als Filter für die Bandaufteilung, das
bei dem oben erwähnten
Bandaufteilungs-Codierverfahren oder bei dem oben erwähnten kombinierten
effizienten Codierverfahren, etc. angewandt ist, ein Filter, beispielsweise
ein sogenanntes QMF-Filter,
etc.. Ein derartiges Filter ist beispielsweise beschrieben in 1976
R. E. Crochiere Digital coding of speech in subbands (Digitale Sprachcodierung
in Subbändern),
Bell Syst. Tech. J. Vol. 55, Nr. 8, 1976.
-
Darüber hinaus ist ein Filter-Aufteilungsverfahren
für bzw.
von gleicher Bandbreite beschrieben beispielsweise in ICASSP 83,
BOSTON, Polyphase Quadrature Filter – A new subband coding technique (Mehrphasen-Quadraturfilter – eine neue
Subband-Kopiertechnik),
Joeph H. Rothweiler.
-
Ferner gibt es als die oben beschriebene Spektrums-Transformationsverarbeitung
beispielsweise eine solche Spektrums-Transformationsverarbeitung, dass ein
Eingangs-Audiosignal in Blöcke
zur jeweils bestimmten Einheitszeit (Rahmen) aufgeteilt wird, um
eine diskrete Fourier-Transformation (DFT), eine diskrete Kosinus-Transformation
(DCT) oder eine modifizierte DCT-Transformation
(MDCT), etc. für
jeweils entsprechende Blöcke
durchzuführen,
um somit Signale auf der Zeitbasis in Signale auf der Frequenzbasis
zu transformieren. Die oben erwähnte MDCT-Transformation
ist beschrieben in ICASSP, 1987, Subband/ Transform Coding Using
Filter Bank Designs Based on Time Domain Aliasing Cancellation (Subband-/Transformationscodierung
unter Heranziehung von Filterbankkonstruktionen auf der Grundlage
einer Zeitbereichsfaltungsaufhebung), J. P. Princen, A. B. Bradley,
Univ. of Surrey Royal Melbourne Inst. of Tech..
-
Durch Quantisieren von Signalen,
die durch Filter- oder Spektrums-Transformationsverarbeitung auf
diese Weise in die jeweiligen Bänder
aufgeteilt sind, ist es möglich,
die Bänder
zu steuern, in denen Quantisierungsrauschen auftritt, und eine effizientere Codierung
unter dem Gesichtspunkt des Gehörsinns vorzunehmen,
indem von der Eigenschaft des Maskierungseffekts, etc. Gebrauch
gemacht wird. Wenn in diesem Falle ein Vorgehen erfolgt, um eine
Normierung der jeweiligen entsprechenden Bänder vorzunehmen, beispielsweise
durch den Maximalwert von Absolutwerten der Signalkomponenten in
den betreffenden entsprechenden Bändern vor der Ausführung einer
Quantisierung, kann ferner eine effiziente Codierung vorgenommen
werden.
-
Darüber hinaus wird als Verfahren
zur Durchführung
einer Frequenzbandaufteilung mit einer Frequenzaufteilungsbreite
zur Quantisierung der betreffenden Frequenzkomponenten, die auf
die jeweiligen Frequenzbänder
aufgeteilt sind, eine Bandaufteilung vorgenommen, bei der beispielsweise
die menschliche Hörsinncharakteristik
berücksichtigt
wird. Es gibt nämlich
Beispiele, bei denen ein Audiosignal in Signalkomponenten ei ner
Vielzahl (von beispielsweise 25) Bändern mit Bandbreiten derart
aufgeteilt wird, dass die Bandbreiten entsprechend breiter werden, wenn
sich die Frequenz zur höheren
Frequenzbandseite hin verschiebt, die generell als kritische Bänder bezeichnet
werden. Bei der Codierung von Daten der jeweiligen entsprechenden
Bänder
zu diesem Zeitpunkt wird eine Codierung durch eine bestimmte Bitzuweisung
bezüglich
der jeweiligen entsprechenden Bänder
vorgenommen, oder es erfolgt eine Codierung durch eine adaptive
Bitzuweisung bezüglich
der jeweiligen entsprechenden Bänder.
So wird beispielsweise bei der Codierung von Koeffizientendaten,
die erhalten worden sind, nachdem die oben erwähnte MDCT-Verarbeitung durch
die oben beschriebene Bitzuweisung erfolgt ist, eine Codierung durch
adaptive Zuweisung von Bitzahlen in Bezug auf die MDCT-Koeffizientendaten
bezüglich
der jeweiligen entsprechenden Bänder
durchgeführt,
die durch die MDCT-Verarbeitung bezüglich der jeweiligen entsprechenden
Blöcke
erhalten worden sind.
-
Als Bitzuweisungsverfahren sind die
folgenden beiden Verfahren bekannt. So wird beispielsweise gemäß IEEE Transactions
of Acoustics, Speech, and Signal Processing, Vol. ASSP-25, Nr. 4,
August 1977, eine Bitzuweisung nämlich
auf der Basis der Größen von
Signalen der jeweiligen entsprechenden Bänder durchgeführt. Gemäß diesem
System wird das Quantisierungsrauschspektrum flach, und die Rauschenergie
wird ein Minimum. Da ein Maskierungseffekt unter dem Gesichtspunkt
des Gehörsinns nicht
angewandt ist, ist jedoch die tatsächliche Rauschwahrnehmung nicht
optimal.
-
Darüber hinaus ist beispielsweise
in ICASSP 1980, The critical band coder – digital encoding of the perceptual
requirements of the auditory system (Der kritische Bandcodierer – digitale
Codierung der Wahrnehmungsanforderungen des Hörsystems), M. A. Kransner MIT,
ein Verfahren beschrieben, bei dem die Gehörsinn-Maskierung ausgenutzt
wird, um die notwendigen Signal-zu-Rausch-Verhältnisse bezüglich der jeweiligen entsprechenden
Bänder
zu erzielen, um eine feste Bitzuweisung vorzunehmen. Da bei dieser
Technik bzw. bei diesem Verfahren die Bitzuweisung sogar in dem
Fall festliegt, dass die Charakteristik mit einem Sinuswellen-Eingangssignal
gemessen wird, kann der charakteristische Wert nicht einen so guten
Wert annehmen.
-
Um diese Probleme zu lösen, ist
in EP-0 525 809-A eine effiziente Codiervorrichtung vorgeschlagen
worden, bei der sämtliche
für eine
Bitzuweisung verwendbaren Bits in dem Zustand genutzt werden, dass
eine Aufteilung in Bits für
ein festliegendes Bitzuweisungsmuster, das vorab für jeweils
entsprechende kleine Blöcke
bestimmt ist, und Bits zur Ausführung
einer Bitzuweisung in Abhängigkeit
von den Größen von
Signalen entsprechender Blöcke
erfolgt, um zu ermöglichen,
dass deren Aufteilungsverhältnis von
einem Signal in Bezug auf ein Eingangssignal abhängt, so dass das Aufteilungsverhältnis bezüglich der
Bits für
das festliegende Bitzuweisungsmuster entsprechend größer wird,
wenn das Spektrum des Signals gleichmäßiger wird.
-
Gemäß diesem Verfahren wird in
dem Fall, dass sich die Energien auf eine bestimmte Spektrumskomponente,
wie ein Sinuswellen-Eingangssignal konzentrieren, eine größere Anzahl
von Bits dem die betreffende Spektrumskomponente enthaltenden Block
zugewiesen, wodurch es ermöglicht
ist, die gesamte Störabstandscharakteristik
merklich zu verbessern. Da der menschliche Gehörsinn generell extrem empfindlich
ist für
ein Signal mit einer scharfen Spektrumskomponente, führt die
Verbesserung der Störabstandscharakteristik
durch Anwendung eines derartigen Verfahrens nicht nur zu einer Verbesserung
im numerischen Wert bei der Messung, sondern auch zu einer effektiven
Verbesserung in der Schallqualität
unter dem Gesichtspunkt des Gehörsinns.
-
Zusätzlich zu dem oben erwähnten Bitzuweisungsverfahren
ist eine große
Anzahl von Verfahren vorgeschlagen worden. Falls ein Modell bezüglich des
Gehörsinns
feiner gestaltet wird und die Fähigkeit
der Codiervorrichtung verbessert wird, kann eine effizientere Codierung
unter dem Gesichtspunkt des Gehörsinns
vorgenommen werden.
-
Nunmehr wird unter Heranziehung von 12 und der nachfolgenden
Zeichnungsfiguren eine konventionelle Signalcodierungsvorrichtung
beschrieben. Gemäß 12 wird ein Akustiksignal bzw.
eine akustische Signalwelle, die über einen Anschluss 100 zugeführt wird,
durch eine Transformationsschaltung 101 in Signalfrequenzkomponenten transformiert.
Sodann werden die betreffenden Komponenten durch eine Signalkomponenten-Codieräschaltung 102 codiert.
Damit wird durch eine Codefolge-Erzeugungsschaltung 103 eine
Codefolge erzeugt und von einem Anschluss 104 abgegeben.
-
Eine konkrete Konfiguration der Transformationsschaltung 101 gemäß 12 ist in 13 veranschaulicht. In 13 wird ein über einen Anschluss 200 (Signal über den
Anschluss 100 gemäß 12) abgegebenes Signal in
Signale von drei Frequenzbändern
durch zwei Stufen von Bandaufteilungsfiltern 201, 202 aufgeteilt.
Im Bandaufteilungsfilter 201 wird das über den Anschluss 200 zugeführte Signal
derart ausgedünnt,
dass es gleich eine Hälfte wird.
Im Bandaufteilungsfilter 202 wird eines der durch das Bandaufteilungsfilter 201 auf
eine Hälfte ausgedünnten Signale
weiter ausgedünnt,
so dass es gleich einer Hälfte
wird (das Signal am Anschluss 200 wird derart ausgedünnt, dass
es gleich zu einem Viertel wird). Die Bandbreiten der beiden Signale vom
Bandaufteilungsfilter 202 betragen nämlich ein Viertel der Bandbreite
des Signals vom bzw. am Anschluss 200.
-
Signale von entsprechenden Bändern, die
in drei Bänder
aufgeteilt werden bzw. sind, wie dies oben beschrieben worden ist,
und zwar durch diese Bandaufteilungsfilter 201, 202,
werden als Spektrumssignalkomponenten von den Spektrums-Transformationsschaltungen 203, 204, 205 herangezogen, um
eine Spektrums-Transformationsverarbeitung, wie eine MDCT-Transformation,
etc. durchzuführen. Die
Ausgangssignale dieser Spektrums-Transformationsschaltungen 203, 204, 205 werden
an die oben erwähnte
Signalkomponenten-Codierschaltung 102 gemäß 12 abgegeben.
-
Eine konkrete Konfiguration der Signalkomponenten-Codierschaltung 102 gemäß 12 ist in 14 veranschaulicht.
-
In 14 wird
ein einem Anschluss 300 zugeführtes Eingangssignal für die Signalkomponenten-Codierschaltung 102 veranlasst,
sich einer Normierung bezüglich
des jeweils bestimmten Bandes durch eine Normierungsschaltung 301 zu
unterziehen, und es wird dann an eine Quantisierungsschaltung 303 abgegeben.
Darüber
hinaus wird das dem Anschluss 300 zugeführte Signal auch einer Quantisierungsgenauigkeits-Festlegungsschaltung
bzw. Bestimmungsschaltung 302 zugeführt.
-
In der Quantisierungsschaltung 303 wird eine
Quantisierung bezüglich
des Signals von der Normierungsschaltung 301 auf der Grundlage
der Quantisierungsgenauigkeit ausgeführt bzw. vorgenommen, die durch
die Quantisierungsgenauigkeits-Festlegungsschaltung 302 aus
dem Signal über den
Anschluss 300 berechnet ist. Das Ausgangssignal von der
Quantisierungsschaltung 303 wird vom Anschluss 304 abgegeben
und an die Codefolge-Erzeugungsschaltung 103 gemäß 12 abgegeben. In dem Ausgangssignal
vom Anschluss 304 sind eine Normierungs-Koeffizienteninformation
in bzw. von der Normierungsschaltung 301 und eine Quantisierungsgenauigkeitsinformation
in bzw. von der Quantisierungsgenauigkeits-Festlegungsschaltung 302 zusätzlich zu
den Signalkomponenten enthalten, die durch die Quantisierungsschaltung 303 quantisiert werden
bzw. sind.
-
Eine Darstellung des Aufbaus bzw.
der Konfiguration einer Decodierungsvorrichtung, die imstande ist,
ein akustisches Signal aus Codefolgen zu decodieren, welche durch
die Codierungsvorrichtung mit dem Aufbau gemäß 12 erzeugt sind, um das decodierte Signal
abzugeben, ist in 15 veranschaulicht.
-
Gemäß 15 werden Codes von entsprechenden Signalkomponenten
durch eine Codefolge-Zerlegungsschaltung 401 aus der durch
den Schaltungsaufbau gemäß 12 erzeugten Codefolge extrahiert
ist, welche über
den Anschluss 400 abgegeben ist. Durch die Signalkomponenten-Decodierschaltung 402 werden
aus jenen Codes entsprechende Signalkomponenten wieder hergestellt
(rekonstruiert). Danach wird eine inverse Transformationsverarbeitung
entsprechend der Transformationsverarbeitung der Transformationsschaltung 101 gemäß 12 durch die Invers-Transformationsschaltung 403 ausgeführt bzw.
implementiert. Somit wird das akustische Signal bzw. Wellensignal
erhalten. Dieses akustische Signal wird vom Anschluss 404 abgegeben.
-
Eine konkrete Konfiguration bzw.
ein konkreter Aufbau der Invers-Transformationsschaltung 403 gemäß 15 ist in 16 veranschaulicht.
-
Der Aufbau bzw. die Konfiguration
gemäß 16 entspricht dem Beispiel
des Aufbaus bzw. der Konfiguration der in 13 dargestellten Transformationsschaltung.
Von der Signalkomponenten-Decodierschaltung 402 über Anschlüsse 501, 502, 503 gelieferte
Signale werden durch Invers-Spektrums-Transformationsschaltungen 504, 505, 506 transformiert,
um eine inverse Spektrums-Transformationsverarbeitung entsprechend
der Spektrums-Transformationsverarbeitung gemäß 13 auszuführen. Signale entsprechender
Bänder,
die durch diese Invers-Spektrums-Transformationsschaltungen 504, 505, 506 erhalten
werden, werden durch zwei Stufen von Bandsynthesefiltern 507, 508 synthetisiert.
-
Die Ausgangssignale der Invers-Spektrums-Transformationsschaltungen 505 und 506 werden
nämlich
zu dem Band-Synthesefilter 507 übertragen, in welchem sie synthetisiert
werden. Ferner werden das Ausgangssignal des Band-Synthesefilters 507 und
das Ausgangssignal der Invers-Spektrums-Transformationsschaltung 504 durch
das Band-Synthesefilter 508 synthetisiert. Das Aus gangssignal
dieses Band-Synthesefilters 508 wird vom Anschluss 509 (Anschluss 404 gemäß 15) abgegeben.
-
17 zeigt
eine Darstellung zur Erläuterung
eines Codierungsverfahrens, welches in der in 12 dargestellten Codiervorrichtung konventionell ausgeführt wird.
Bei dem Beispiel gemäß 17 stellt das Spektrumssignal
ein Signal dar, welches durch die Transformationsschaltung gemäß 13 erhalten wird. 17 veranschaulicht Pegel
von Absolutwerten der Spektrumssignale (Signalkomponenten) durch
eine MDCT-Transformation
in dB-Werten.
-
In 17 wird
ein Eingangssignal in 64 Spektrumssignale im jeweils bestimmten
Zeitblock transformiert. Jene Spektrumssignale werden in Gruppen
(nachstehend als Codierungseinheiten bezeichnet) von je fünf bestimmten
Bändern
kombiniert, die in 17 mit
b1 bis b5 bezeichnet sind, und sie werden veranlasst, sich einer
Normierung und Quantisierung zu unterziehen. Bei diesem Beispiel
werden die Bandbreiten der betreffenden Codiereinheiten veranlasst,
auf der unteren Frequenzbandseite schmal und auf der höheren Frequenzbandseite
breit zu sein, so dass eine Steuerung bezüglich des Auftretens des Quantisierungsrauschens
entsprechend der Eigenschaft des Gehörsinns durchgeführt werden
kann.
-
Bei dem oben beschriebenen, konventionell angewandten
Verfahren liegen die Bänder,
in denen Frequenzkomponenten quantisiert werden, jedoch fest. Aus
diesem Grunde müssen
beispielsweise in dem Fall, dass sich die Spektrumskomponenten in den
Bereichen in der Nähe
von verschiedenen spezifischen Frequenzen konzentrieren, viele Bits
einer großen
Anzahl von Spektrumskomponenten zugewiesen werden, die zum selben
Band wie dem jener Spektrumskomponenten gehören, falls versucht wird, jene
Spektrumskomponenten mit ausreichender Genauigkeit zu quantisieren.
-
Wie aus der 17 hervorgeht, werden nämlich, wie
oben erwähnt,
dann, wenn eine Normierung in dem Zustand vorgenommen wird, in welchem Signale
der jeweiligen bestimmten Bänder
kombiniert werden, die Normierungskoeffizientenwerte auf der Basis
eines großen
Normierungskoeffizientenwertes normiert, der durch die Toncharakteristikkomponente bestimmt
ist, beispielsweise im Frequenzband b3 in der betreffenden Zeichnungsfigur,
in welchem die Toncharakteristikkomponente im Signal enthalten ist.
-
Zu dieser Zeit ist das im akustischen
Signal der Toncharakteristik, bei der sich die Energien der Spektrumskomponenten
auf eine spezifische bzw, bestimmte Frequenz oder auf Frequenzen
konzentrieren, enthaltene Rauschen für das Ohr generell sehr offensiv
im Vergleich zum Rauschen, das bei einem akustischen Signal zum
Tragen kommen, bei dem die Energien über ein weites Frequenzband sanft
verteilt sind und daher ein großes
Hindernis unter dem Gesichtspunkt des Gehörsinns darstellen. Falls Spektrumskomponenten
mit einer hohen Energie, das heißt die Toncharakteristikkomponenten nicht
mit hinreichend guter Genauigkeit quantisiert werden bzw. sind,
dann wird ferner in dem Fall, dass jene Spektrumskomponenten veranlasst
werden, die Wellenformsignale auf der Zeitbasis für eine zweite Zeit
zu sein, um sie mit Blöcken
zuvor und danach zu synthetisieren, die Verzerrung zwischen den
Blöcken groß, und es
tritt eine starke Verbindungsverzerrung auf, wenn die Synthetisierung
mit Wellenformsignalen benachbarter Zeitblöcke erfolgt, so dass sich auch
ein starkes Hindernis unter dem Gesichtspunkt des Gehörsinns ergibt.
Aus diesem Grunde muss zur Codierung der Toncharakteristikkomponenten
eine Quantisierung mit einer hinreichend großen Anzahl von Bits vorgenommen
werden. In dem Fall, dass die Quantisierungsgenauigkeiten für die jeweiligen
bestimmten Frequenzbänder,
wie oben beschrieben, bestimmt bzw. festgelegt sind, ist es jedoch
notwendig, viele Bits einer großen
Anzahl von Spektrumskomponenten innerhalb der Codiereinheiten zuzuweisen,
die die Toncharakteristikkomponenten enthalten, um deren Quantisierung
durchzuführen,
was zu einem schlechten Codierungswirkungsgrad führt. Demgemäß war es in konventioneller
Weise schwierig, den Wirkungsgrad der Codierung ohne Verschlechterung
der Tonqualität
zu verbessern, und zwar insbesondere im Hinblick auf akustische
Signale der Toncharakteristik.
-
Typische Codierungs- und Decodierungsverfahren
und -vorrichtungen, wie sie oben erörtert worden sind, sind in
WO 89/10661-A1 und US 5.040.217 angegeben. Gemäß WO 89/10661-A1 werden gewisse
Frequenzbänder überhaupt
nicht genutzt, und es werden lediglich bestimmte andere Frequenzbänder auf
einer Erfahrungs-Annahme hin kombiniert, ob jene Frequenzbänder eine
wesentliche Information enthalten oder nicht. Gemäß US 5.040.217
(=EP 0 424 016 A2) werden eine MDCT-Transformation und eine variable
Längencodierung
in einem 1-Kanal-System angewandt, wobei Informationskomponenten,
die als nicht wesentlich betrachtet werden, maskiert werden. Somit
gehen sowohl mögliche
wesentliche Informationen (Toncharakteristik) als auch Hintergrundinformationen
(Rauschcharakteristik) verloren.
-
Offenbarung
der Erfindung
-
Mit Rücksicht auf die obige Sachlage
besteht eine Aufgabe der Erfindung darin, eine Signalcodierungsvorrichtung,
mit der der Wirkungsgrad der Codierung verbessert werden kann, ohne
eine Tonqualität
eines insbesonderen akustischen Signals einer Toncharakteristik
zuzulassen, sowie einen Aufzeichnungsträger, der so geeignet ist, dass
durch eine derartige Signalcodierungsvorrichtung verarbeitete Signale
darauf oder darin aufgezeichnet werden, und eine Signaldecodierungsvorrichtung
bereitzustellen, die geeignet ist für die Decodierung eines codierten Signals,
welches von einem derartigen Aufzeichnungsträger wiedergegeben ist oder
welches von einer Signalcodierungsvorrichtung übertragen ist, wie sie oben
erwähnt
wurde.
-
Die diese Aufgaben lösende Erfindung
ist in den unabhängigen
Patentansprüchen
angegeben. Weitere Merkmale sind in den abhängigen Patentansprüchen aufgeführt.
-
Hier führt die Signalcodierungsvorrichtung dieser
Erfindung eine Verarbeitung durch, wie sie unten beschrieben ist.
So ist nämlich
die erste Codiereinrichtung derart betrieben, dass sie bei der Codierung
des ersten Signals die Amplitudeninformation der betreffenden Toncharakteristikkomponenten
des ersten Signals mit bzw. durch einen Normierungskoeffizienten
normiert, woraufhin jene normierte Amplitudeninformation codiert
wird. Darüber
hinaus codiert diese Signalcodierungsvorrichtung entsprechende Frequenzkomponenten
der betreffenden Toncharakteristikkomponenten nach einer Vielzahl
von Transformationsregeln. Welche Regel der Vielzahl von Transformationsregeln
bei der Ausführung
der Codierung angewandt wird, wird durch die relative Positionsbeziehung
auf der Frequenzbasis zwischen der maximalen Frequenzkomponente
und entsprechenden Frequenzkomponenten der Toncharakteristikkomponenten
bestimmt. Die auf die Maximalfrequenzkomponente angewandte Transformationsregel
der oben erwähnten
Transformationsregeln führt eine
Transformationsverarbeitung zu kürzeren
Codes im Hinblick auf Frequenzkomponenten durch, die über eine
Information verfügen,
welche eine größere Amplitudenwertinformation
aufweist. Die bei den anderen Frequenzkomponenten der Maximalfrequenzkomponente
angewandte Transformationsregel der oben erwähnten Transformationsregeln
führt eine Transformationsverarbeitung
zu kürzeren
Codes im Hinblick auf Frequenzkomponenten durch, die über eine
Information von geringerer Amplitudenwertinformation verfügen. In
diesem Falle ist das Eingangssignal ein akustisches Signal.
-
Darüber hinaus normiert und quantisiert
die erste Codiereinrichtung der Signalcodierungsvorrichtung gemäß dieser
Erfindung die Amplitudeninformation der betreffenden Toncharakteristikkomponenten des
ersten Signals mit bzw. durch Normierungskoeffizienten, um sie zu
codieren, und sie lässt
die Am plitudeninformation der Maximalfrequenzkomponente bei dieser
Codierung weg.
-
Die Signalcodierungsvorrichtung gemäß dieser
Erfindung führt
in diesem Falle eine Verarbeitung durch, wie sie unten beschrieben
ist. Die Trenn- bzw. Abtrenneinrichtung ermöglicht nämlich den Toncharakteristikkomponenten,
sich auf der Frequenzbasis einander zu überlappen, um eine Abtrennung
des ersten Signals vorzunehmen. Werte der Normierungskoeffizienten
werden so festgelegt, dass demgemäß dann, wenn jene Werte kleiner
werden, die Genauigkeit größer wird.
Außerdem
stellt auch in diesem Falle das Eingangssignal ein akustisches Signal dar.
-
Ein Aufzeichnungsträger dieser
Erfindung bzw. gemäß dieser
Erfindung ist derart geeignet, dass auf ihm oder in ihm ein Signal
aufgezeichnet wird, bestehend Toncharakteristikkomponenten, die derart
codiert sind, dass sie unterschiedliche Längen aufweisen, und dass auf
ihm oder in ihm ein zweites Signal aufgezeichnet wird, das aus anderen
Komponenten besteht.
-
Der Aufzeichnungsträger gemäß dieser
Erfindung wird unten betrachtet. Die Amplitudeninformation von entsprechenden
Toncharakteristikkomponenten des ersten Signals wird nämlich durch
bzw. mittels Normierungskoeffizienten normiert und codiert. Darüber hinaus
werden die betreffenden Frequenzkomponenten der Toncharakteristikkomponenten
nach einer Vielzahl von Transformationsregeln codiert. Jede Regel
der betreffenden Vielzahl von Transformationsregeln, die bei der
Ausführung
der Codierung angewandt wird, wird bzw. ist durch die relative Positionsbeziehung
auf der Frequenzbasis zwischen der Maximalfrequenzkomponente und
den betreffenden Frequenzkomponenten der Toncharakteristikkomponenten
bestimmt. Die bei der maximalen Frequenzkomponente angewandte Transformationsregel
der oben erwähnten
Transformationsregeln führt
eine Transformationsverarbeitung zu kürzeren Codes in Bezug auf die
Frequenzkomponenten durch, die über
eine Information von größeren Amplituden werten
verfügen.
Die auf anderen entsprechenden Frequenzkomponenten der maximalen
Frequenzkomponente angewandte Transformationsregel der oben erwähnten Transformationsregeln
führt eine
Transformationsverarbeitung zu kürzeren
Codes in Bezug auf Frequenzkomponenten mit einer Information durch,
die geringere Amplitudenwerte aufweist. In diesem Falle ist das
aufzuzeichnende Signal ein akustisches Signal.
-
Darüber hinaus ist ein Aufzeichnungsträger gemäß dieser
Erfindung derart geeignet, dass ein erstes Signal, bestehend aus
Toncharakteristikkomponenten, und ein zweites Signal, bestehend
aus anderen Komponenten, in einer voneinander getrennten Weise aufgezeichnet
werden. In diesem Falle werden durch Normierung und Quantisierung
einer Amplitudeninformation der Toncharakteristikkomponenten des
ersten Signals erhaltene Signale zu deren Codierung aufgezeichnet.
Darüber
hinaus werden Informationen mit Ausnahme der Informationen, die
durch Normierung und Quantisierung der Amplitudeninformation der
Maximalfrequenz erhalten werden, als erste Signale aufgezeichnet.
-
Hier wird eine Aufzeichnung in einer
solchen Art und Weise vorgenommen, dass Toncharakteristikkomponenten
des ersten Signals sich auf der Frequenzbasis einander überlappen.
Normierungskoeffizienten für
die Normierung werden so festgelegt, dass dementsprechend dann,
wenn jene Werte kleiner werden, die Genauigkeit größer wird.
-
Eine Signaldecodierungsvorrichtung
gemäß dieser
Erfindung umfasst eine erste Decodiereinrichtung zum Decodieren
eines ersten Signals, bestehend aus Toncharakteristikkomponenten,
die so codiert sind, dass sie unterschiedliche Längen aufweisen, eine zweite
Decodiereinrichtung zum Codieren eines zweiten Signals, welches
andere Komponenten enthält,
und eine Synthese-Invers-Transformationseinrichtung zum Synthetisieren
der betreffenden Signale zu deren inverse Transformation oder zur
inversen Transformation entsprechender Signale für deren Synthetisierung.
-
Die Signaldecodiervorrichtung dieser
Erfindung wird unten ausgeführt.
Die Amplitudeninformationen der betreffenden Toncharakteristikkomponenten
des ersten Signals werden nämlich
mittels Normierungskoeffizienten normiert, und sie werden codiert.
Darüber
hinaus werden die betreffenden Frequenzkomponenten der Toncharakteristikkomponenten
nach einer Vielzahl von Transformationsregeln codiert. Jede Regel
der betreffenden Vielzahl von Transformationsregeln, die bei der
Ausführung
der Codierung angewandt werden, wird durch die relative Positionsbeziehung
auf der Frequenzbasis zwischen der Maximalfrequenzkomponente und
dem betreffenden Frequenzkomponenten der Toncharakteristikkomponenten
bestimmt. Die Transformationsregel, die auf die Maximalfrequenzkomponente
aus den oben erwähnten
Transformationsregeln angewandt ist, führt eine Transformationsverarbeitung
zu kürzeren
Codes in Bezug auf die Frequenzkomponenten mit Informationen von
größeren Amplitudenwerten durch.
Die Transformationsregel, die aus den oben erwähnten Transformationsregeln
auf Komponenten, mit Ausnahme der Maximalfrequenzkomponente angewandt
ist, führt
eine Transformationsverarbeitung zu kürzeren Codes in Bezug auf Frequenzkomponenten
mit Informationen von geringeren Amplitudenwerten durch. In diesem
Fall stellt das Ausgangssignal ein akustisches Signal dar.
-
Überdies
umfasst die Signaldecodierungsvorrichtung gemäß dieser Erfindung eine erste
Decodiereinrichtung zum Decodieren eines ersten Signals, welches
Toncharakteristikkomponenten enthält, die in dem Zustand codiert
sind, in welchem eine Information ausgeschlossen ist, die durch
Normierung und Quantisierung der Amplitudeninformation der Maximalfrequenzkomponenten
erhalten wird, eine zweite Decodiereinrichtung zum Decodieren eines zweiten
Signals, welches aus anderen bzw. weiteren Komponenten besteht,
und eine Synthetisier-Invers-Transformationseinrichtung zum Synthetisieren der
betreffenden Signale zu deren inverser Transformation oder zur inversen
Transformation entsprechender Signale zu deren Synthetisierung.
-
In diesem Falle werden bzw. sind
die Toncharakteristikkomponenten des ersten Signals in einem Zustand
codiert, in welchem sie sich auf der Frequenzbasis einander überlappen.
Zusätzlich
sind die Normierungskoeffizienten für die Normierung so festgelegt,
dass demgemäß dann,
wenn jene Werte kleiner werden, die Genauigkeit größer wird.
-
Gemäß dieser Erfindung wird im
Falle der Ausführung
der Codierung bei einem eingangsseitigen Signal im Zustand der Aufteilung
in Signalkomponenten (Toncharakteristikkomponenten), wobei sich
die Energien auf eine bestimmte Frequenz und Komponenten konzentrieren
(Komponenten mit Ausnahme der Toncharakteristikkomponenten), bei
denen die Energien in einem breiten Frequenzband sanft bzw. leicht
verteilt sind, eine Codierung mit einer variablen Länge effektiv
auf Signale von Toncharakteristikkomponenten angewandt, wodurch
eine effizientere Codierung realisiert wird. Im Hinblick auf einen
Spektrumskoeffizienten, bei dem der absolute Wert ein Maximum ist,
wobei beispielsweise lediglich die positive und negative Codeinformation
codiert ist, wird dadurch überdies
eine effizientere Codierung realisiert.
-
Kurze Beschreibung
der Zeichnungen
-
1 zeigt
ein Schaltungsdiagramm, in welchem in einer Blockform der Aufbau
einer Codierungsvorrichtung gemäß einer
Ausführungsform
der Erfindung veranschaulicht ist.
-
2 veranschaulicht
in einer Blockform ein Schaltungsdiagramm des Aufbaus einer Decodierungsvorrichtung
gemäß der Ausführungsform
der Erfindung.
-
3 veranschaulicht
in einem Flussdiagramm den Verarbeitungsablauf in einer Signalkomponenten-Trennschaltung gemäß der Erfindung.
-
4 veranschaulicht
in einer Ansicht die Abtrennung einer Toncharakteristikkomponente
bei der Signalcodierung gemäß der Erfindung.
-
5 zeigt
eine Darstellung zur Erläuterung einer
Rauschcharakteristikkomponente, wobei Toncharakteristikkomponenten
aus einem ursprünglichen
Spektrumssignal bei der Signalcodierung gemäß der Erfindung entfernt sind.
-
6 zeigt
eine Darstellung eines Beispiels eines Spektrumssignals.
-
7 zeigt
in einer Ansicht ein Signal, das durch Codierung und Decodierung
erhalten ist, und bei dem eine Toncharakteristikkomponente von dem Spektrumssignal
gemäß 6 subtrahiert ist.
-
8 zeigt
eine Darstellung zur Erläuterung einer
Transformationsregel in Bezug auf das Spektrum von Toncharakteristikkomponenten
bei der Erfindung.
-
9 veranschaulicht
in einer Blockform ein Schaltungsdiagramm einer konkreten Konfiguration der
Toncharakteristik-Codierschaltung gemäß 1.
-
10 veranschaulicht
in einer Blockform ein Schaltungsdiagramm, welches eine konkrete Konfiguration
der Toncharakteristik-Decodierschaltung gemäß 2 zeigt.
-
11 zeigt
eine Ansicht zur Erläuterung
der Aufzeichnung einer Codefolge, die erhalten wird, nachdem eine
Codierung durch ein Signalcodierungssystem gemäß dieser Erfindung erfolgt
ist.
-
12 veranschaulicht
in einer Blockform ein Schaltungsdiagramm, welches den Aufbau einer konventionellen
Codierungsvorrichtung zeigt.
-
13 veranschaulicht
in einer Blockform ein Schaltungsdiagramm, welches einen konkreten Aufbau
von Transformationsschaltungen gemäß diesem Ausführungsbeispiel
und einer konventionellen Codierungsvorrichtung veranschaulicht.
-
14 veranschaulicht
in einer Blockform ein Schaltungsdiagramm, welches einen konkreten Aufbau
einer Signalkomponenten-Codierschaltung gemäß dieser Erfindung und einer
konventionellen Codierungsvorrichtung zeigt.
-
15 zeigt
in einer Blockform ein Schaltungsdiagramm, in welchem die Konfiguration
der konventionellen Decodierungsvorrichtung veranschaulicht ist.
-
16 zeigt
in einer Blockform ein Schaltungsdiagramm, welches eine konkrete
Konfiguration von Invers-Transformationsschaltungen
veranschaulicht, die bei der Erfindung und einer konventionellen Decodierungsvorrichtung
angewandt sind.
-
17 zeigt
eine Ansicht zur Erläuterung
eines Codierverfahrens nach dem Stand der Technik.
-
18 zeigt
in einer Blockform ein Schaltungsdiagramm unter Veranschaulichung
eines weiteren Beispiels eines Synthese-Invers-Transformationsabschnitts,
der eine Decodierungsvorrichtung gemäß der Erfindung darstellt.
-
19 zeigt
in einer Blockform ein Schaltungsdiagramm einer weiteren Ausführungsform
einer Codierungsvorrichtung gemäß dieser
Erfindung.
-
20A veranschaulicht
in einer Codetabelle eine Transformationsregel in Bezug auf einen
Maximal-Spektrumskoeffizienten.
-
20B veranschaulicht
in einer Codetabelle eine Transformationsregel von peripheren Spektrumskoeffizienten
in dem Fall, dass dieselbe Transformationsregel in Bezug auf sämtliche
peripheren Komponenten angewandt wird.
-
Beste Ausführungsform
zur Ausführung
der Erfindung
-
Nunmehr werden unter Bezugnahme auf
die beigefügten
Zeichnungen bevorzugte Ausführungsbeispiele
dieser Erfindung beschrieben.
-
1 veranschaulicht
die Grundzüge
des Aufbaus einer Signalcodierungsvorrichtung gemäß einer
Ausführungsform
der Erfindung.
-
Gemäß 1 wird einem Anschluss 600 ein akustisches
Wellenformsignal bzw. ein akustisches Signal zugeführt. Diese
akustische Signalwellenform wird mittels einer Transformationsschaltung 601 in Signalfrequenzkomponenten
transformiert und dann an eine Signalkomponenten-Trennschaltung 602 abgegeben.
-
In dieser Signalkomponenten-Trennschaltung 602 werden
von der Transformationsschaltung 601 erhaltene Signalfrequenzkomponenten
in Toncharakteristikkomponenten mit einer scharfen Spektrumsverteilung
und in Signalfrequenzkomponenten mit Ausnahme der obigen Komponenten
aufgeteilt, das heißt
in eine Rauschcharakteristikkomponente mit einer flachen Spektrumsverteilung.
Die Toncharakteristikkomponenten mit der scharfen Spektrumsverteilung
von diesen abgetrennten Frequenzkomponenten werden durch eine Toncharakteristikkomponenten-Codierschaltung 603 codiert,
und die Rauschcharakteristikkomponenten, die Signalfrequenzkomponenten
mit Ausnahme der obigen Komponenten darstellen, werden durch eine
Rauschcharakteristikkomponenten-Codierschaltung 604 codiert.
Das von Toncharakteristikkomponenten-Codierschaltung 603 abgegebene
Signal wird einer variablen Längencodierung
in der eine variable Längencodierung
vornehmenden Codierschaltung 610 unterzogen. Die Ausgangssignale
der variablen Längencodierschaltung 610 und
der Rauschcharakteristikkomponenten-Codierschaltung 604 werden
einer Codefolgen-Erzeugungsschaltung 605 eingangsseitig
zugeführt,
in der eine Codefolge erzeugt wird. Die so erzeugte Codefolge wird
von der betreffenden Schaltung abgegeben. Ein ECC-Codierer 606 fügt einen
Fehlerkorrekturcode zu der Codefolge von der Codefolge-Erzeugungsschaltung 605 hinzu.
Das Ausgangssignal von dem ECC-Codierer 606 wird durch
eine EFM-Schaltung 607 moduliert. Das so erhaltene modulierte
Signal wird an einen Aufzeichnungskopf 608 abgegeben. Dieser
Aufzeichnungskopf 608 zeichnet die von der EFM-Schaltung 607 abgegebene
Codefolge auf einer Platte 609 auf.
-
Es sei darauf hingewiesen, dass ein
Aufbau entsprechend bzw. ähnlich
dem von 13, wie oben
erwähnt,
als Transformationsschaltung 601 angewandt werden kann.
Selbstverständlich
kann man sich für
den konkreten Aufbau der Transformationsschaltung 601 gemäß 1 eine große Anzahl
von Konfigurationen vorstellen, allerdings mit Ausnahme der oben
erwähnten
Konfiguration gemäß 13. So kann das Eingangssignal
beispielsweise direkt durch eine MDCT-Transformation in ein Spektrumssignal
transformiert werden, und eine DFT- oder DCT-Transformation, etc. kann anstelle der MDCT-Transformation
als Spektrumstransformationsverarbeitung angewandt werden.
-
Während
ein Signal durch ein Bandaufteilungsfilter in Frequenzkomponentensignale
aufgeteilt werden kann, wie dies zuvor beschrieben worden ist, ist überdies
mit Rücksicht
darauf, dass die Codierung gemäß der Erfindung
insbesondere in dem Fall effektiv ausgeführt wird, in welchem Energien
auf eine bestimmte Frequenz oder auf bestimmte Frequenzen konzentriert
sind, die Anwendung eines Verfahrens zur Transformation in Frequenzkomponenten
durch die oben beschriebene Spektrums-Transformationsverarbeitung zweckmäßig, durch
die eine große
Anzahl von Frequenzkomponenten mittels einer relativ kleinen Operationsgröße erzielt
wird.
-
Ferner können die Toncharakteristikkomponenten-Codierschaltung 603 und
die Rauschcharakteristikkomponenten-Codierschaltung 604 grundsätzlich durch
einen Aufbau entsprechend jenem gemäß 14 realisiert werden, wie er oben erwähnt worden
ist.
-
Andererseits zeigt 2 die Grundzüge des Aufbaus einer Signaldecodierungsvorrichtung
gemäß der Ausführungsform
der Erfindung zum Decodieren eines durch die Codierungsvorrichtung
gemäß 1 codierten Signals.
-
In 2 wird
eine von der Platte 609 mittels eines Wiedergabekopfes 708 wiedergegebene
Codefolge an eine EF-Demodulationsschaltung 709 abgegeben
(die mit Demodulation von EFM-Daten
bezeichnet ist). Diese EF-Demodulationsschaltung 709 demoduliert
die eingegebene Codefolge. Die demodulierte Codefolge wird an einen
ECC-Decoder 710 abgegeben, in welchem eine Fehlerkorrektur
vorgenommen wird. Eine Codefolgen-Zerlegungsschaltung 701 erkennt
auf der Grundalge der Toncharakteristikkomponenteninformations-Nummer
der fehlerkorrigierten Codefolge, welcher Teil der Codefolge zum
Toncharakteristikkomponentencode gehört, um die eingegebene Codefolge
in Toncharakteristikkomponentencodes und Rauschcharakteristikkomponentencodes
aufzuteilen. Darüber
hinaus trennt die Codefolge-Trennschaltung 701 die Positionsinformation der
Toncharakteristikkomponente aus der eingegebenen Codefolge, um diese
an eine Synthese- bzw. Synthetisierschaltung 704 der nachfolgenden
Stufe anzugeben. Die Toncharakteristikkomponentencodes werden veranlasst,
sich einer variablen Längendecodierung
mittels der eine variable Längendecodierung
vornehmenden Decodierungsschaltung 715 zu unterziehen,
und sie werden dann an eine Toncharakteristikkomponenten-Decodierschaltung 702 abgegeben;
die Rauschcharakterstikkomponentencodes werden an eine Rauschcharakteristikkomponenten-Decodierschaltung 703 abgegeben,
wobei in den betreffenden Schaltungen eine inverse Quantisierung
und eine Auflösung
der Normierung vorgenommen und entsprechende Komponenten decodiert
werden. Danach werden decodierte Signale von der Toncharakteristikkomponenten-Decodierschaltung 702 und
der Rauschcharakteristikkomponenten-Decodierschaltung 703 an
die Synthese- bzw. Synthetisierschaltung 704 abgegeben,
und zwar zur Durchführung
einer Synthese entsprechend der Aufteilung in der Signalkomponenten-Trennschaltung 602 gemäß 1. Die Syntheseschaltung 704 fügt das decodierte
Signal der Toncharakteristikkomponente einer bestimmten Position
des decodierten Signals der Rauschcharakteristikkomponente auf der Grundlage
der Positionsinformation der Toncharakteristikkomponente hinzu,
die von der Codefolge-Trennschaltung 701 geliefert ist,
um dadurch eine Synthese auf der Frequenzbasis der Rauschcharakteristikkomponente
und der Toncharakteristikkomponente durchzuführen. Ferner wird das so synthetisierte
decodierte Signal veranlasst, sich einer inversen Transformationsverarbeitung
in der Invers-Transformationsschaltung 705 zu unterziehen, um
eine der Transformationsverarbeitung in der Transformationsschaltung 601 gemäß 1 entsprechende inverse
Transformationsverarbeitung auszuführen, so dass ein Signal auf
der Frequenzbasis veranlasst wird, das Originalsignal bzw. das Original-Wellensignal
auf der Zeitbasis zum zweiten Mal zu sein. Das Ausgangswellenformsignal
von der Invers-Transformationsschaltung 705 wird von einem Anschluss 707 abgegeben.
Es sei darauf hingewiesen, dass die Verarbeitungsreihenfolge der
inversen Transformation und der Synthese entgegengesetzt zu der
obigen Reihenfolge sein kann. In diesem Falle ist der synthetische
bzw. Synthese-Invers-Transformationsabschnitt 711 in 2 so aufgebaut, wie dies in 18 veranschaulicht ist.
Die den Synthese-Invers-Transformationsabschnitt 711 bildende
Invers-Transformationsschaltung 712 nimmt eine inverse
Transformation des decodierten Signals der Rauschcharakteristikkomponente
auf der Frequenzbasis von der Rauschcharakteristikkomponenten-Decodierschaltung 703 in
ein Rauschcharakteristik-Komponentensignal
auf der Zeitbasis vor. Die Invers-Transformationsschaltung 713 ordnet
das decodierte Signal der Toncharakteristikkomponente von der Toncharakteristikkomponenten-Decodierschaltung 702 an
einer Position auf der Frequenzbasis an, die durch die Positionsinformation
der von der Codefolgen-Trennschaltung 701 für die inverse
Transformation abgegebene Positionsinformation der Toncharakteristikkomponente
bezeichnet ist, um ein Toncharakteristikkomponentensignal auf der
Zeitbasis zu erzeugen. Die Syntheseschaltung 714 synthetisiert
das Rauschcharakteristikkomponentensignal auf der Zeitbasis von
der Invers-Transformationsschaltung 712 und das Toncharakteristikkomponentensignal
auf der Zeitbasis von der Invers-Transformationsschaltung 713,
um somit das Original-Wellenformsignal zu erzeugen.
-
Es sei darauf hingewiesen, dass der
dem oben erwähnten
Aufbau gemäß 16 entsprechende Aufbau
für die
Invers-Transformationsschaltungen 705, 712, 713 verwendet
werden kann.
-
3 veranschaulicht
den Ablauf einer tatsächlichen
Verarbeitung zur Abtrennung der Toncharakteristikkomponente in der
Signalkomponenten-Trennschaltung 602 der Codierungsvorrichtung gemäß 1.
-
In 3 ist
mit I die Zahl bzw. Nummer von Spektrumssignalen bezeichnet, mit
N ist die Gesamtzahl von Spektrumssignalen bezeichnet und mit P,
R sind bestimmte Koeffizienten bezeichnet. Überdies wird die oben erwähnte Toncharakteristikkomponente
auf der Grundlage folgender Berücksichtigung
bestimmt. In dem Fall, dass der Absolutwert eines gewissen Spektrumssignals
bei lokaler Betrachtung größer ist
als andere Spektrumskomponenten, ist nämlich die Differenz zwischen
dem Absolutwert und dem Maximalwert von absoluten Werten von Spektrumssignalen
im entsprechenden Zeitblock (das ist der Block in der Spektrums-Transformationsverarbeitung)
ein bestimmter Wert oder ein höherer
Wert, und die Summe dieser Spektrums- und benachbarten Spektrumskomponenten
(z. B. die Spektrumskomponenten, die in beiden Richtungen benachbart
sind) gibt ein bestimmtes Verhältnis
oder ein größeres Verhältnis in
Bezug auf die Energie innerhalb eines bestimmten Bandes an, welches
jene Spektrumskomponenten enthält.
Dieses Spektrumssignal und beispielsweise dazu in beiden Richtungen
benachbarte Spektrumssignale werden als Toncharakteristikkomponenten
berücksichtigt.
Es sei darauf hingewiesen, dass als ein bestimmtes Band für einen
Vergleich des Verhältnisses
der Energieverteilung ein Band angewandt werden kann, so dass die
Bandbreite in einem unteren Frequenzband schmaler ist und in einem
höheren
Frequenzband beispielsweise entsprechend kritischen Bandbreiten
breit ist, indem die Eigenschaft des Gehörsinns berücksichtigt wird.
-
In 3 wird
zunächst
beim Schritt S1 ein maximaler Spektrums-Absolutwert für die Variable AO
gesetzt. Beim Schritt S2 wird die Zahl bzw. Nummer I des Spektrumssignals
auf 1 gesetzt. Beim Schritt S3 wird ein bestimmter bzw. gewisser
Spektrums-Absolutwert innerhalb eines gewissen Zeitblocks für die Variable
A gesetzt.
-
Beim Schritt S4 wird entschieden,
ob der Spektrums-Absolutwert der maximale Absolutwert des Spektrums,
bei lokaler Betrachtung ist, der größer als andere Spektrumskomponenten
ist oder nicht. Wenn als Ergebnis festgestellt wird, dass es nicht
das maximale Absolutwert-Spektrum (NEIN) ist, dann geht die Verarbeitungsoperation
weiter zum Schritt 510. Im Unterschied dazu geht die Verarbeitungsoperation
zum Schritt S5 in dem Fall weiter, dass es sich um das maximale
Absolutwert-Spektrum (JA) handelt.
-
Beim Schritt S5 wird das Verhältnis zwischen der
Variablen A des maximalen Absolutwert-Spektrums entsprechend dem
Zeitblock, der das maximale Absolutwert-Spektrum enthält, und
der Variablen AO des maximalen Spektrums-Absolutwerts und dem Koeffizienten
P, der eine bestimmte Größe anzeigt,
verglichen (A/AO > P). Als Ergebnis geht die Verarbeitungsoperation
in dem Fall, dass A/A0 größer ist
als P (JA) weiter zum Schritt S6. Im Gegensatz dazu geht die Verarbeitungsoperation
in dem Fall, dass A/A0 kleiner ist als P
(NEIN) weiter zum Schritt S10.
-
Beim Schritt S6 wird der Energiewert
des Nachbarspektrums (beispielsweise die Summe der Energien der
dem entsprechenden Spektrum in beiden Richtungen benachbarten Spektrumskomponenten)
des Spektrums des Spektrums-Absolutwerts (maximales Absolutwert-Spektrum)
ersetzt für
die Variable X. Beim nachfolgenden Schritt S7 wird der Energiewert
innerhalb eines bestimmten Bandes, welches das maximale Absolutwert-Spektrum
und dessen benachbarte Spektren enthält, für die Variable Y eingesetzt.
-
Beim nachfolgenden Schritt S8 wird
das Verhältnis
zwischen der Variablen X des Energiewerts und der Variablen Y des
Energie- werts innerhalb
eines bestimmten Bandes und dem Koeffizienten R verglichen, das
ein bestimmtes Verhältnis
anzeigt (X/Y > R).
Wenn als Ergebnis X/Y größer ist
als R (JA), geht die Verarbeitungsoperation weiter zum Schritt S9.
Wenn im Gegensatz dazu X/Y kleiner ist als R (NEIN), geht die Verarbeitungsoperation
weiter zum Schritt 510.
-
Beim Schritt S9 werden in dem Fall,
dass die Energie im maximalen Absolutwertspektrum und den dazu benachbarten
Spektrumskomponenten ein bestimmtes oder größeres Verhältnis in Bezug auf die Energie
innerhalb eines bestimmten Bandes anzeigt, welches jene Spektrumskomponenten
enthält,
das Signal seiner maximalen Absolutwert-Spektrumskomponente und
beispielsweise Signale von dazu in beiden Richtungen benachbarten
Spektrumskomponenten als Toncharakteristikkomponente betrachtet, um
diesen Umstand zu registrieren.
-
Beim nachfolgenden Schritt S10 wird
entschieden, ob die Nummer bzw. Zahl I des beim Schritt S9 registrierten
Spektrumssignals und die Gesamtzahl N der Spektrumssignale einander
gleich sind (I = N) oder nicht. Als Ergebnis wird in dem Fall, dass
die betreffenden Signale einander gleich sind (JA), die Verarbeitung
beendet. Im Gegensatz dazu geht die Verarbeitungsoperation in dem
Fall, dass die betreffenden Signale nicht einander gleich sind (NEIN),
weiter zum Schritt 511. Bei diesem Schritt S11 wird I festgelegt
auf I = I + 1, um die Nummer bzw. Zahl der Spektrumssignale um 1
zu erhöhen
(zu inkrementieren). Damit kehrt die Verarbeitungsoperation zum
Schritt S3 zurück,
um die oben erwähnte Verarbeitung
zu wiederholen. Die Signalkomponenten-Trennschaltung 602 gibt
eine Frequenzkomponente oder Frequenzkomponenten, bezüglich der durch
die oben beschriebene Verarbeitung entschieden ist, dass es die
Toncharakteristikkomponente ist, an die Toncharakteristik-Codierschaltung 603 ab, und
die betreffende Schaltung gibt andere Frequenzkomponenten als Rauschcharakteristikkomponente an
die Rauschcharakteristikkomponenten-Codierschaltung 604 ab.
Darüber
hinaus gibt die Signalkomponenten-Trennschaltung 602 die
Nummer bzw.
-
Zahl der Frequenzinformation, die
als Toncharakteristikkomponente entschieden ist, und eine Information über die
betreffende Position an die Codefolgen-Erzeugungsschaltung 605 ab.
-
4 veranschaulicht
den Zustand eines Beispiels, bei dem Toncharakteristikkomponenten aus
Frequenzkomponenten in einer Weise getrennt sind, wie dies oben
beschrieben worden ist.
-
Bei dem in 4 dargestellten Beispiel sind vier Toncharakteristikkomponenten
extrahiert, die in der betreffenden Figur mit TCA,
TCB, TCC, TCD bezeichnet sind. Da diese Toncharakteristikkomponenten
in dem Zustand, in welchem sie auf eine kleine Anzahl von Spektrumssignalen,
wie beim Beispiel gemäß 4, verteilt sind, ist sogar
dann, wenn diese Komponenten mit einer guten Genauigkeit quantisiert
werden bzw. sind, eine große
Anzahl von Bits insgesamt nicht so erforderlich. Während danach
die Toncharakteristikkomponenten einmal normiert werden, um die
normierten Komponenten zu quantisieren und um den Codierungswirkungsgrad
zu verbessern, können
daher mit Rücksicht
darauf, dass die Spektrumssignale, welche die Toncharakteristikkomponente
bilden, in der Anzahl relativ klein sind, die Verarbeitung der Normierung
und/oder die Requantisierung weggelassen werden bzw. entfallen,
womit die Vorrichtung bzw. Anordnung vereinfacht ist.
-
Unterdessen veranschaulicht 5 das Beispiel, bei dem
Rauschcharakteristikkomponenten gezeigt sind, in denen Toncharakteristikkomponenten aus
dem ursprünglichen
Spektrumssignal entfernt sind.
-
Wie in 5 gezeigt,
sind die Toncharakteristikkomponenten, wie oben beschrieben, aus
dem ursprünglichen
Spektrumssignal in den Bändern
b1 ~ b5 entfernt (veranlasst dazu, Null zu sein). In diesem Falle
werden die Normierungskoeffizienten in den betreffenden Codierungseinheiten
zu einem kleinen Wert. Demgemäß kann erzeugtes
Quantisierungsrauschen sogar mit einer kleinen Anzahl von Bits verringert
werden.
-
Während
beschrieben worden ist, dass eine Lösung angewandt wird, um die
Toncharakteristikkomponente abzutrennen, damit ermöglicht ist,
dass die Toncharakteristikkomponenten und die Signalkomponenten
in deren Nähe
danach zu Null werden, um die Rauschcharakteristikkomponenten zu
codieren, ist es dadurch ermöglicht,
eine effiziente Codierung zu realisieren. Dabei kann ein Verfahren
zum Codieren von Signalkomponenten angewandt werden, die durch Subtrahieren
eines Signals erhalten werden, welches aus der Codierung von Toncharakteristikkomponenten
erhalten wird, um jene Komponenten von dem ursprünglichen Spektrumssignal zu decodieren.
-
Eine nach diesem Verfahren arbeitende
Signalcodiervorrichtung wird nunmehr unter Bezugnahme auf 19 beschrieben. Es sei darauf
hingewiesen, dass dieselben Bezugszeichen denselben Komponenten
wie jenen in 1 gegeben
sind und dass ihre Erläuterung
weggelassen wird.
-
Das Spektrumssignal, welches von
der Transformationsschaltung 601 erhalten wird, wird an eine
Toncharakteristikkomponenten-Extrahierschaltung 802 über einen
Schalter 801 abgegeben, der von einer Steuerschaltung 808 gesteuert
wird. Diese Toncharakteristikkomponenten-Extrahierschaltung 802 diskriminiert
die Toncharakteristikkomponente durch die oben beschriebene Verarbeitung
gemäß 3, um lediglich die diskriminierte
Toncharakteristikkomponente an die Toncharakteristikkomponenten-Codierschaltung 603 abzugeben. Überdies
gibt die Toncharakteristikkomponenten-Extrahierschaltung 802 die
Nummer bzw. Zahl der Toncharakteristikkomponenteninformation und
deren Mittenpositionsinformation an die Codefolge-Erzeugungsschaltung 605 ab.
Die Toncharakteristikkomponenten-Codierschaltung 603 führt eine
Normierung und Quantisierung bezüglich
der eingegebenen Toncharakteristikkomponente aus, um die normierte
und quantisierte Toncharakteristikkomponente an die eine variable Längencodierung
vornehmende Codierschaltung 610 und an einen lokalen Decoder 804 abzugeben. Diese
eine variable Längencodie rung
vornehmende Codierschaltung 610 führt eine variable Längencodierung
bezüglich
der normierten und quantisierten Toncharakteristikkomponente aus,
um den so erhaltenen variablen Längencode
an die Codefolgen-Erzeugungsschaltung 605 abzugeben. Dieser
lokale Decoder 804 führt
eine inverse Quantisierung und Aufhebung der Normierung bezüglich der
normierten und quantisierten Toncharakteristikkomponente aus, um
das Signal der ursprünglichen
Toncharakteristikkomponente zu decodieren. Es sei darauf hingewiesen,
dass Quantisierungsrauschen im decodierten Signal zu diesem Zeitpunkt
enthalten wäre.
Das Ausgangssignal vom lokalen Decoder 804 wird einem Addierer 805 als
erstes decodiertes Signal zugeführt. Darüber hinaus
wird das ursprüngliche
Spektrumssignal von der Transformationsschaltung 601 dem
Addierer 805 über
den Schalter 806 zugeführt,
der durch die Schalter-Steuerschaltung 808 gesteuert wird.
Dieser Addierer 805 subtrahiert das erste decodierte Signal
von dem ursprünglichen
bzw. Original-Spektrumssignal, um das erste Differenzsignal abzugeben.
In dem Fall, dass die Verarbeitungsfolge des Extrahierens, Codierens,
Decodierens, der Differenzbestimmung der Toncharakteristikkomponente durch
lediglich eine Verarbeitungsfolge abgeschlossen wird, wird das oben
erwähnte
erste Differenzsignal als Rauschcharakteristikkomponente an die Rauschcharakteristikkomponenten-Codierschaltung 604 über einen
Schalter 807 abgegeben, der durch die Schalter-Steuerschaltung 808 gesteuert
wird. Darüber
hinaus wird die Verarbeitungsfolge des Extrahierens, Codierens,
Decodierens, der Differenzbestimmung der Toncharakteristikkomponente
wiederholt, und das erste Differenzsignal wird über den Schalter 801 an
die Toncharakteristikkomponenten-Extrahierschaltung 802 abgegeben.
Die Toncharakteristikkomponenten-Extrahierschaltung 802,
die Toncharakteristikkomponenten-Codierschaltung 603 und
der lokale Decoder 804 führen eine der obigen Verarbeitung
entsprechende bzw. ähnliche
Verarbeitung aus. Damit wird das zweite erhaltene decodierte Signal
an den Addierer 805 abgegeben. Überdies wird das erste Differenzsignal
dem Addierer 805 über den
Schalter 806 zugeführt.
Der Addierer 805 subtrahiert das zweite decodierte Signal
von dem ersten Differenzsignal, um das zweite Differenzsignal abzugeben.
Ferner wird in dem Fall, dass die Verarbeitungsfolge des Extrahierens,
Codierens, Decodierens, der Differenzbestimmung der Toncharakteristikkomponente
durch zweimalige Verarbeitungsfolge abgeschlossen wird, das zweite
Differenzsignal an die Rauschcharakteristikkomponenten-Codierschaltung 804 über den
Schalter 807 als Rauschcharakteristikkomponente abgegeben.
In dem Fall, dass die Verarbeitungsfolge des Extrahierens, Codierens,
Decodierens, der Differenzbestimmung der Toncharakteristikkomponente
weiterhin wiederholt wird, wird eine der oben beschriebenen Verarbeitung
entsprechende bzw. ähnliche
Verarbeitung durch die Toncharakteristikkomponenten-Extrahierschaltung 802, die
Toncharakteristikkomponenten-Codierschaltung 603, den lokalen
Decoder 804 und den Addierer 805 ausgeführt. Die
Schalter-Steuerschaltung 808 hält den Schwellwert der Toncharakteristikkomponenten-Informationszahl
fest und steuert den Schalter 807 so, dass die Extrahierung,
die Codierung, die Decodierung und die Differenzbestimmung der Verarbeitungsfolge
der Toncharakteristikkomponente in dem Fall abgeschlossen wird,
dass die von der Toncharakteristikkomponenten-Extrahierschaltung
erhaltene Toncharakteristikkomponenten-Informationszahl oberhalb
des Schwellwertes liegt. Darüber
hinaus kann in der Toncharakteristikkomponenten-Codierschaltung 603 eine
derartige Verarbeitung angewandt werden, dass dann, wenn das Extrahieren
der Toncharakteristikkomponente aufhört, die Extraktion, Codierung,
Decodierung und Differenzbestimmungs-Verarbeitungsfolge der Toncharakteristikkomponente
abgeschlossen wird bzw. ist.
-
6 und 7 zeigen Darstellungen zur
Erläuterung
eines derartigen Verfahrens, wobei 7 ein Signal
zeigt, in welchem ein durch Codieren einer Toncharakteristikkomponente
erhaltenes Signal zur Decodierung des codierten Signals von dem
Spektrumssignal gemäß 6 subtrahiert ist.
-
Darüber hinaus werden in der Figur
durch gestrichelte Linien bezeichnete Komponenten ferner aus dem
Spektrumssignal gemäß
-
7 als
Toncharakteristikkomponente extrahiert, wodurch ermöglicht wird,
die Codierungsgenauigkeit des Spektrumssignals zu verbessern. Durch
Wiederholen einer derartigen Operation kann eine Codierung mit hoher
Genauigkeit ausgeführt werden.
In dem Fall, dass dieses Verfahren angewandt wird, kann sogar dann,
wenn die obere Grenze der Anzahl der Bits für die Quantisierung der Toncharakteristikkomponente
auf einen niedrigen Wert festgelegt ist, die Codierungsgenauigkeit
hinreichend hoch sein. Demgemäß liegt
hier auch der Vorzug bzw. Verdienst vor, dass die Anzahl der Bits
für die Aufzeichnungsquantisierungsbitanzahl
verringert werden kann. Ferner kann das in einer mehrstufigen Weise,
wie oben ausgeführt,
ablaufende Verfahren zum Extrahieren von Toncharakteristikkomponenten notwendigerweise
nicht nur in dem Fall angewandt werden, in dem ein Signal, welches
einem Signal äquivalent
ist, das durch Codieren der Toncharakteristikkomponente erhalten
wird, um das codierte Signal zu decodieren, von dem Original-Spektrumssignal
subtrahiert wird, sondern auch in dem Fall, in welchem ein Spektrumssignal
der extrahierten Toncharakteristikkomponente zu Null gemacht wird.
Bei der Beschreibung dieser Erfindung sollte die Angabe bzw. der
Ausdruck, dass "ein Signal, aus dem die Toncharakteristikkomponenten
abgetrennt sind", etc. als Angabe bzw. Begriff betrachtet werden,
die bzw. der die oben erwähnten
beiden Fälle
einschließt.
-
Während
in der Codiervorrichtung dieser Ausführungsform, wie oben beschrieben,
das Original-Wellenformsignal in Toncharakteristikkomponenten und
Rauschcharakteristikkomponenten zerlegt wird, um eine Codierung
auszuführen,
wodurch eine effizientere Codierung realisiert wird, wird ein Verfahren,
wie es unten beschrieben ist, in Verbindung mit der Codierung der
Toncharakteristikkomponenten angewandt, um dadurch die Durchführung einer
noch effizienteren Codierung zu ermöglichen.
-
Im Hinblick auf die betreffenden
Toncharakteristikkomponenten konzentrieren sich nämlich Energien
auf einen Spektrumskoeffizienten, bei dem der Absolutwert ein Maximum
wird (der nach stehend als Maximal-Spektrumskoeffizient bezeichnet
wird), und auf periphere Spektrumskoeffizienten (die nachstehend
als periphere Spektrumskoeffizienten bezeichnet werden). In diesem
Falle tritt irgendeine Abweichung in der Teilung der Werte auf,
wenn die betreffenden Koeffizienten quantisiert werden, und der
Zustand (Art und Weise) der Verteilung des maximalen Spektrumskoeffizienten
und jener der peripheren Spektrumskoeffizienten sind stark voneinander
verschieden, und zwar in Abhängigkeit
von der relativen Positionsbeziehung der Frequenzbasis. Falls die
die betreffenden Tonkomponenten darstellenden Spektrumskoeffizienten
durch den Normierungskoeffizienten normiert werden, der durch den
maximalen Spektrumskoeffizienten bestimmt ist, das heißt wenn
die die Toncharakteristikkomponenten bildenden entsprechenden Spektrumskoeffizienten
durch den maximalen Spektrumskoeffizienten in jene Toncharakteristikkomponenten
aufgeteilt sind, dann wird nämlich der
maximale Spektrumskoeffizient nach der Quantisierung gleich einem
Wert, der näher
bei +1 oder –1 liegt.
Im Gegensatz dazu werden mit Rücksicht
darauf, dass die Tonkomponenten mit der Charakteristik, gemäß der die
Spektrumskoeffizienten hauptsächlich abrupt
bei in einer Mitte liegendem maximalen Spektrumskoeffizienten abnehmen,
die peripheren Spektrumskoeffizienten nach der Quantisierung bei
einer höheren
Frequenz bei Werten näher
bei Null verteilt.
-
In dem Fall, dass irgendeine Abweichung
in der Verteilung der zu codierenden Werte vorliegt, wie oben erwähnt, wird
ein sogenannter variabler Längencode
angewandt, um eine kürzere
Codelänge dem
Muster hoher Frequenz zuzuordnen, wie dies beispielsweise beschrieben
ist von D. A. Huffman: A Method for Construction of Minimum Redundancy Codes
(Ein Verfahren zur Bildung von Codes minimaler Redundanz), Proc.
I.R.E., 40, Seite 1098 (1952), wodurch es ermöglicht ist, eine effiziente
Codierung auszuführen.
-
Angesichts der obigen Ausführungen
werden in der Signalcodierungsvorrichtung gemäß der Ausführungsform dieser Erfindung die
betreffenden Toncharakteristikkomponenten in einen maximalen Spektrumskoeffizienten
und in periphere Spektrumskoeffizienten aufgeteilt, um unterschiedliche
variable Längencodes
auf die betreffenden Spektrumskoeffizienten anzuwenden, damit eine
effiziente Codierung realisiert wird.
-
Es sei darauf hingewiesen, dass mit
Rücksicht
darauf, dass die Toncharakteristikkomponenten eine sehr scharfe
Spektrumsverteilung auf der Frequenzbasis besitzen, die Verteilung
der Werte in dem Fall, dass die peripheren Spektrumskoeffizienten normiert
und quantisiert sind, stark durch die relative Positionsbeziehung
auf der Frequenzbasis zwischen jenen peripheren Spektrumskoeffizienten
und dem maximalen Spektrumskoeffizienten beeinflusst wird. Mit Rücksicht
hierauf ist es erwünscht,
ein Vorgehen zur weiteren Klassifizierung (Unterteilung) von peripheren
Spektrumskoeffizienten in verschiedene Sätze (Gruppen) in Abhängigkeit
von der relativen Position auf der Frequenzbasis in Bezug auf den
maximalen Spektrumskoeffizienten anzuwenden, um sie nach Transformationsregeln
in unterschiedliche variable Längencodes
der jeweiligen unterteilten Sätze (Gruppen)
zu transformieren.
-
Als Verfahren zur Klassifizierung
der relativen Position kann ein Verfahren zur Durchführung einer
Klassifikation nach Absolutwerten der Differenz auf der Frequenzbasis
in Bezug auf die maximalen Spektrumskoeffizienten angewandt werden.
-
In Bezug auf das beispielsweise in 8 dargestellte Spektrum
der Toncharakteristikkomponenten werden nämlich insgesamt drei Transformationsregeln
angewandt, die Transformationsregel in Bezug auf den maximalen Spektrumskoeffizienten, der
in der Figur mit ECc bezeichnet ist, die Transformationsregel in
Bezug auf die peripheren Spektrumskoeffizienten, die in der Figur
mit ECb und ECd bezeichnet sind, und die Transformationsregel in
Bezug auf die peripheren Spektrumskoeffizienten, die in der Figur
mit ECa und ECe bezeichnet sind, um eine Transformationsverarbeitung
zu variablen Längencodes
auszuführen.
-
Selbstverständlich kann die variable Längencodierung
nach derselben Transformationsregel in Bezug auf sämtliche
peripheren Spektrumskoeffizienten zum Zwecke der Vereinfachung der
Verarbeitung ausgeführt
werden.
-
Ein Beispiel einer Codetabelle, welche
die Transformationsregel in Bezug auf den maximalen Spektrumskoeffizienten
veranschaulicht, ist in 20A dargestellt.
Darüber
hinaus ist ein Beispiel einer Codetabelle, die die Transformationsregel
der peripheren Spektrumskoeffizienten in dem Fall veranschaulicht,
dass dieselbe Regel in Bezug auf sämtliche peripheren Spektrumskoeffizienten
angewandt wird, in 20B veranschaulicht.
-
Der maximale Spektrumskoeffizient
nach der Normierung und Quantisierung, das heißt der quantisierte Wert des
maximalen Spektrums ist gleich einem Wert, der näher bei +1 oder –1 liegt,
wie dies oben beschrieben worden ist. Somit ist es, wie in 20A veranschaulicht, dann,
wenn 00 und 01 Codes mit Codelängen
sind, die kürzer
sind als Codelängen,
die anderen Werten zugewiesen sind, möglich, den maximalen Spektrumskoeffizienten
effizient zu codieren.
-
Darüber hinaus werden periphere
Spektrumskoeffizienten nach der Normierung und Quantisierung, das
heißt
die quantisierten Werte der peripheren Spektrumskomponenten gleich
einem Wert, der näher
bei Null liegt, wie dies oben beschrieben worden ist. Somit ist
es, wie in 20 veranschaulicht, in
dem Fall, dass 0, der eine Codelänge
besitzt, die kürzer
ist als die Codelängen,
die anderen Werten zugewiesen sind, der oben erwähnten 0 (Null) zugewiesen ist,
möglich,
die peripheren Spektrumskoeffizienten effizient zu codieren.
-
Falls eine Vielzahl von Codetabellen
bezüglich
der maximalen Spektrumskomponenten und eine Vielzahl von Codetabellen
bezüglich
der peripheren Spektrumskoeffizienten mit der jeweiligen Quantisierungsgenauigkeit
vorgesehen sind, die in der Toncha rakteristikkomponenten-Codierschaltung 603 festgelegt
ist, um eine entsprechende Codetabelle in Übereinstimmung mit der festgelegten
bzw. bestimmten Quantisierungsgenauigkeit auszuwählen, dann kann ferner eine
effizientere Codierung durchgeführt werden.
-
9 zeigt
ein konkretes Beispiel der eine variable Längencodierung vornehmenden
Codierschaltung 610 gemäß 1.
-
Gemäß 9 werden die dem Anschluss 800 eingangsseitig
zugeführten
Toncharakteristikkomponenten durch die relative Position auf der
Frequenzbasis in Bezug auf die maximale Spektrumskomponente durch
die Steuerschaltung 801 klassifiziert (aufgeteilt). Die
so klassifizierten Spektrumskomponenten werden an die Maximal-Spektrumskoeffizienten-Codierschaltung 802,
die periphere Spektrumskoeffizienten-Codierschaltung 803 und
die dieser entsprechende periphere Spektrumskoeffizienten-Codierschaltung 804 abgegeben
In diesen betreffenden Schaltungen werden jene Spektrumskomponenten
auf der Basis der oben beschriebenen entsprechenden Transformationsregeln
codiert. Die codierten Ausgangssignale von den betreffenden Codierschaltungen 802, 803, 804 werden
durch die Steuerschaltung 801 vom Ausgangsanschluss 805 abgegeben.
-
10 zeigt
ein konkretes Beispiel der oben beschriebenen, eine variable Längendecodierung vornehmenden
Decodierschaltung 715 gemäß 2.
-
Gemäß 10 werden die dem Eingangsanschluss 900 eingangsseitig
zugeführten
Toncharakteristikkomponentencodes entsprechend der Klassifikation
von 9 klassifiziert.
Die so klassifizierten Codes werden an die Maximal-Spektrumskoeffizienten-Decodierschaltung 902,
die periphere Spektrumskoeffizienten-Decodierschaltung 903 und die
dieser entsprechende periphere Spektrumskoeffizienten-Decodierschaltung 904 abgegeben.
In diesen betreffenden Schaltungen werden jene Codes auf der Grundlage
von inversen Transformationsregeln decodiert, die den oben beschriebenen
Transformationsregeln entsprechen. Die decodierten Ausgangssignale
von den betreffenden Decodierschaltungen 902, 903, 904 werden
vom Ausgangsanschluss 905 durch die Steuerschaltung 901 abgegeben.
-
11 zeigt
ein Beispiel für
den Fall, dass das Spektrumssignal gemäß 4 durch die Codierungsvorrichtung dieser
Ausführungsform
codiert wird bzw. ist. Die so erhaltenen Codefolgen werden auf einem
Aufzeichnungsträger
aufgezeichnet.
-
Bei diesem Beispiel wird die Toncharakteristikkomponenten-Information Nr. tnc
(z. B. 4 beim Beispiel gemäß 11) zuerst auf dem Aufzeichnungsträger aufgezeichnet.
Sodann werden die Toncharakteristikkomponenteninformation tcA, tcB, tcC, tcD und die Rauschcharakteristikkomponenteninformation nc1, nc2, nc3, nc4, nc5 in der aufgeführten Reihenfolge aufgezeichnet.
In der Toncharakteristikkomponenteninformation tcA,
tcB, tcC, tcD werden die Mittenpositionsinformation CP,
welche die Position der Mitte des Spektrums der Toncharakteristikkomponente
angibt (z. B. 15 im Falle beispielsweise der Toncharakteristikkomponente
tcB), eine Quantisierungsgenauigkeitsinformation,
welche die Anzahl der Bits für
die Quantisierung angibt (z. B. 6 im Falle beispielsweise der Toncharakteristikkomponente
tcB) und eine Normierungskoeffizienteninformation
zusammen mit einer entsprechenden Signalkomponenteninformation SCa, SCb, SCc, SCd, SCe aufgezeichnet, die veranlasst waren, sich
einer Normierung und Quantisierung zu unterziehen. Sodann werden
die betreffenden Signalkomponenteninformationen veranlasst, sich
einer variablen Längencodierung
zu unterziehen. Bei diesem Beispiel werden die Transformationsregeln
der variablen Längencodierung
bezüglich der
jeweiligen Quantisierungsgenauigkeit vorab festgelegt. Die Decodierungsvorrichtung
führt eine
Decodierung von variablen Längencodes
dadurch aus, dass auf die Quantisierungsgenauigkeitsinformation Bezug
genommen wird.
-
Hier ist es z. B. in solchen Fällen, in
denen die Quantisierungsgenauigkeit durch die Frequenz fest vorgegeben
bzw. be stimmt ist, selbstverständlich unnötig, eine
Quantisierungsgenauigkeitsinformation aufzuzeichnen. Während beim
oben beschriebenen Ausführungsbeispiel
die Position der Mittenspektrumskomponente der betreffenden Toncharakteristikkomponenten
als Positionsinformation der Toncharakteristikkomponenten verwendet
wird, ist darauf hinzuweisen, dass die Position der Spektrumskomponente
des untersten Frequenzbandes der betreffenden Toncharakteristikkomponenten
(z. B. 14 im Falle der Toncharakteristikkomponente TCB)
aufgezeichnet werden bzw. sein kann.
-
Überdies
werden in Bezug auf die Rauschcharakteristikkomponenteninformation
eine Quantisierungsgenauigkeitsinformation (z. B. 2 im Falle der Rauschcharakteristikkomponente
nc1) und eine Normierungskoeffizienteninformation
zusammen mit der normierten und quantisierten Signalkomponenteninformation
SC1, SC2, ... SC8 aufgezeichnet.
-
In dem Fall, dass die Quantisierungsgenauigkeitsinformation
Null ist, wird hier eine Codierung in der betreffenden Codiereinheit
tatsächlich
nicht ausgeführt.
In dem Fall, dass die Quantisierungsgenauigkeit je Band entsprechend
dem obigen fest vorgegeben bzw. bestimmt ist, ist es unnötig, eine
Quantisierungsgenauigkeitsinformation aufzuzeichnen.
-
11 zeigt
das Ausführungsbeispiel
der Art und Reihenfolge der auf einem Aufzeichnungsträger aufgezeichneten
Informationen. So sind beispielsweise die Informationen bis zu der
Signalkomponenteninformation SCa, SCb, SCc, SCd, SCe Codes von variabler
Länge,
und deren Längen
sind nicht fest.
-
Die Signalcodierungsvorrichtung dieser
Ausführungsform
verfügt über eine
Fähigkeit,
in Bezug auf die maximale Spektrumskomponente der betreffenden Toncharakteristikkomponenten
ihre Amplitudeninformation lediglich durch Normierung der Koeffizienteninformation
bereitzustellen, um die Ausführung
einer effizienteren Codierung zu ermöglichen. Die Toncharakteristik- bzw. Toncharakteristikkomponenten-Codierschaltung 603 führt nämlich eine
Normierung und Quantisierung in Bezug auf Frequenzkomponenten mit
Ausnahme der maximalen Spektrumskomponente der betreffenden Toncharakteristikkomponenten
durch. Es sei darauf hingewiesen, dass daher ein Aufbau bzw. eine
Konfiguration angewandt werden kann, bei dem bzw. der die Normierung
und Quantisierung in Bezug auf sämtliche
betreffenden Toncharakteristikkomponenten einschließlich des
maximalen Spektrums in der Toncharakteristikkomponenten-Codierschaltung 603 ausgeführt werden,
und der quantisierte Wert entsprechend dem maximalen Spektrum wird
nicht an der Codefolge-Erzeugungsschaltung 605 der nachfolgenden Stufe
abgegeben. In dem Fall, dass eine derartige Codierung ausgeführt wird,
enthält
die Signalkomponenteninformation SCc lediglich
Codes, die beim Beispiel gemäß 11 eine positive und negative
Anzeige liefern.
-
Da der Wert ungefähr der Amplitudeninformation
des maximalen Spektrums hauptsächlich
als Normierungskoeffizient ausgewählt wird, ist es hier in dem
Fall, dass Normierungskoeffizienten auf einem Aufzeichnungsträger aufgezeichnet
werden bzw. sind, möglich,
ungefähre
Werte der Amplitudeninformation des maximalen Spektrums aus jenen
Normierungskoeffizienten zu erhalten. In dem Fall, dass beispielsweise
die Spektrumsinformation durch eine MDCT- oder durch eine DCT-Transformation,
etc. realisiert wird, kann demgemäß der ungefähre Wert des maximalen Spektrums
aus Codes, die Positives und Negatives anzeigen, und aus der Normierungskoeffizienteninformation
erhalten werden. In dem Fall, dass beispielsweise die Spektrumsinformation durch
eine DFT-Transformation, etc. realisiert ist, kann überdies
der ungefähre
Wert des maximalen Spektrums allein aus einer Phasenkomponente erhalten
werden. Damit kann die Aufzeichnung der durch Quantisieren der Amplitudeninformation
in Bezug auf das maximale Spektrum erhaltenen Information entfallen.
Dieses Verfahren ist besonders effektiv in dem Fall, dass die Normierung
mit hoher Genauigkeit sichergestellt werden kann.
-
In dem Fall, dass die Genauigkeit
des Normierungskoeffizienten in diesem Fall in der Signalcodierungsvorrichtung
nicht ausreicht, kann es sein, dass die Genauigkeit des maximalen
Spektrumskoeffizienten nicht hinreichend sichergestellt werden kann.
Das Verfahren, bei dem die in 19 dargestellte
Konfiguration bzw. der dort gezeigte Aufbau verwendet wird, um Toncharakteristikkomponenten in
einer mehrstufigen Weise zu extrahieren, wird jedoch angewandt,
um zu ermöglichen,
das oben erwähnte
Problem zu lösen.
Wie in 6 und 7 veranschaulicht, besteht
entsprechend diesem Verfahren eine starke Möglichkeit dafür, dass
die sich auf der Frequenzbasis einander überlappenden Frequenzkomponenten
mehrmals als Toncharakteristikkomponenten extrahiert werden. In
diesem Falle ist es erwünscht,
eine solche nichtlineare Einstellung vorzunehmen, dass eine Einstellung
bezüglich
des jeweiligen festliegenden Intervalls vorgenommen wird, beispielsweise
durch eine logarithmische Skala, damit dann, wenn die Werte der
Normierungskoeffizienten kleiner werden, eine höhere Genauigkeit bereitgestellt
wird.
-
Wenn eine derartige Vielzahl von
Frequenzkomponenten auf der Seite der Decodierungsvorrichtung synthetisiert
wird, dann ist es sogar in dem Fall, dass die Genauigkeit eines
Normierungskoeffizienten nicht ausreicht, somit möglich, eine
Genauigkeit eines gewissen Grades sicherzustellen. Obwohl das Beispiel,
bei dem das akustische Signal durch die Signalcodierungsvorrichtung
gemäß der Ausführungsform
der Erfindung codiert wird, hauptsächlich beschrieben worden ist,
kann das Codieren bei dieser Erfindung überdies auf das Codieren des
generellen Wellenformsignals angewandt werden. Es sei darauf hingewiesen,
dass die Codierung gemäß dieser
Erfindung insbesondere effektiv ist bei der Ausführung einer effizienten Codierung
bezüglich
eines akustischen Signals, bei dem Toncharakteristikkomponenten
eine signifikante Bedeutung unter dem Gesichtspunkt des Gehörsinns besitzen.
-
Ferner kann die Platte 609 bei
der oben beschriebenen Ausführungsform
beispielsweise ein magnetooptischer Aufzeichnungsträger, ein
optischer Aufzeichnungsträger
oder ein optischer Aufzeichnungsträger vom Phasenänderungstyp,
etc. sein. Ferner können
ein Halbleiterspeicher oder eine IC-Karte, etc. zusätzlich zu
einem bandförmigen
Aufzeichnungsträger
als Aufzeichnungsträger
verwendet werden, der die Platte 609 ersetzt.
-
Obwohl der Fall, dass lediglich Toncharakteristikkomponenten
veranlasst sind, sich einer variablen Längencodierung zu unterziehen,
bei der oben beschriebenen Ausführungsform
beschrieben worden ist, können überdies
Rauschcharakteristikkomponenten ebenfalls veranlasst werden bzw.
sein, sich einer variablen Längencodierung
zu unterziehen.
-
Industrielle
Anwendbarkeit
-
Wie aus der vorstehenden Beschreibung
klar ist, werden in der Signalcodiervorrichtung gemäß dieser
Erfindung beim Transformieren eines Eingangssignals in Frequenzkomponenten
zur Aufteilung des transformierten Ausgangssignals in ein erstes
Signal, bestehend aus Toncharakteristikkomponenten, und ein zweites
Signal, bestehend aus anderen Komponenten, zur Codierung dieser
ersten und zweiten Signale entsprechende Signalkomponenten des ersten
Signals so codiert, dass sie unterschiedliche Codelängen aufweisen,
wodurch ermöglicht
ist, die Toncharakteristikkomponenten des in Toncharakteristikkomponenten
und in Rauschcharakteristikkomponenten zerlegten Signals extrem
effizient zu codieren. Damit kann der Codierungswirkungsgrad bezüglich der
Gesamtheit der Signalwellenform verbessert werden. Falls derart
komprimierte Signale auf oder in einem Aufzeichnungsträger aufgezeichnet
werden, kann demgemäß die Aufzeichnungskapazität effektiv
genutzt werden, Wenn durch Wiedergabe eines derartigen Aufzeichnungsträgers erhaltene
Signale decodiert werden, können
darüber
hinaus zufriedenstellende Signale, beispielsweise akustische Signale,
erhalten werden,