DE69432538T2

DE69432538T2 - Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger

Info

Publication number: DE69432538T2
Application number: DE69432538T
Authority: DE
Inventors: Mito Sonohara; Kyoya Tsutsui
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1993-06-30
Filing date: 1994-06-29
Publication date: 2004-04-01
Anticipated expiration: 2014-06-30
Also published as: EP0663739B1; CN1099777C; WO1995001680A1; CN1440144A; DE69428030D1; PL173718B1; DE69432538D1; JP3721582B2; US5765126A; EP0663739A4; DE69428030T2; EP1083674A2; CN1217502C; PL307740A1; CN1113096A; EP0663739A1; KR100368854B1; EP1083674B1; KR950703231A; BR9405445A

Description

Vorrichtung und Verfahren zur Signalcodierung und Signaldecodierung sowie Aufzeichnungsträger, auf dem mit der Vorrichtung oder nach dem Verfahren codierte Signale aufgezeichnet sind
Technisches Gebiet
Die Erfindung bezieht auf eine Signalcodiervorrichtung, bei der eine solche Codierung von Informationen, wie von digitalen Signaldaten, etc. zur effizienten Codierung eines digitalen Signals, wie von eingangsseitigen digitalen Daten, etc. zur Übertragung oder Aufzeichnung des codierten digitalen Signals angewandt wird, sowie auf einen Signalaufzeichnungsträger, der derart geeignet ist, dass durch eine derartige Signalcodierungsvorrichtung codierte Signale aufgezeichnet werden, und auf eine Signaldecodierungsvorrichtung, bei der eine derartige Decodierung von Informationen, wie von digitalen Daten, etc. zur Decodierung eines codierten Signals, das von einem Aufzeichnungsträger, wie oben erwähnt, wiedergegeben oder von einer Signalcodiervorrichtung, wie oben erwähnt, übertragen wird, angewandt wird, um ein Wiedergabesignal zu erhalten.
Hintergrund-Technik
Bisher gibt es verschiedene effiziente Codierverfahren bzw. -techniken für Audiosignale oder Sprachsignale, etc.. Als repräsentativ hierfür kann eine Bandaufteilungs-Codierung aufgeführt werden (Subbandcodierung (SBC)), die ein nicht blockbildendes Frequenzbandunterteilungssystem darstellt, mit dem ein Audiosignal, etc. auf der Zeitbasis in Signalkomponenten in einer Vielzahl von Frequenzbändern, zu einer jeweils bestimmten Einheitszeit aufgeteilt wird, ohne damit eine Blockbildung auszuführen, um die betreffenden Signale zu codieren, das ist eine sogenannte Transformationscodierung, die das Blockbildungs-Frequenzband-Unterteilungssystem darstellt, um ein Signal auf der Zeitbasis in Blöcke zur jeweiligen bestimmten Einheitszeit zu unterteilen, um die betreffenden Signale auf der Zeitbasis in Signale auf der Frequenzbasis mit bzw. nach jeweils entsprechenden Blöcken zu transformieren (Spektrums-Transformationsverarbeitung), um die auf diese Weise transformierten Signale in Signalkomponenten in einer Vielzahl von Frequenzbändern aufzuteilen, damit diese in den jeweiligen entsprechenden Frequenzbändern codiert werden, und dergleichen. Darüber hinaus ist auch schon ein effizientes Codierverfahren vorgeschlagen worden, bei dem die Bandunterteilungs-Codierung und die Transformationscodierung, wie oben beschrieben, kombiniert sind. In diesem Falle wird beispielsweise ein Signal auf der Zeitbasis in Signale in einer Vielzahl von Bändern durch die oben erwähnte Bandunterteilungs-Codierung aufgeteilt, um danach eine Spektrums-Transformation der Signale der jeweiligen entsprechenden Bänder in Signale auf der Frequenzbasis vorzunehmen, um damit die Codierung in die spektrums-transformierten Signale der jeweiligen entsprechenden Bänder auszuführen.
Hier gibt es als Filter für die Bandaufteilung, das bei dem oben erwähnten Bandaufteilungs-Codierverfahren oder bei dem oben erwähnten kombinierten effizienten Codierverfahren, etc. angewandt ist, ein Filter, beispielsweise ein sogenanntes QMF-Filter, etc.. Ein derartiges Filter ist beispielsweise beschrieben in 1976 R. E. Crochiere Digital coding of speech in subbands (Digitale Sprachcodierung in Subbändern), Bell Syst. Tech. J. Vol. 55, Nr. 8, 1976.
Darüber hinaus ist ein Filter-Aufteilungsverfahren für bzw. von gleicher Bandbreite beschrieben beispielsweise in ICASSP 83, BOSTON, Polyphase Quadrature Filter – A new subband coding technique (Mehrphasen-Quadraturfilter – eine neue Subband-Kopiertechnik), Joeph H. Rothweiler.
Ferner gibt es als die oben beschriebene Spektrums-Transformationsverarbeitung beispielsweise eine solche Spektrums-Transformationsverarbeitung, dass ein Eingangs-Audiosignal in Blöcke zur jeweils bestimmten Einheitszeit (Rahmen) aufgeteilt wird, um eine diskrete Fourier-Transformation (DFT), eine diskrete Kosinus-Transformation (DCT) oder eine modifizierte DCT-Transformation (MDCT), etc. für jeweils entsprechende Blöcke durchzuführen, um somit Signale auf der Zeitbasis in Signale auf der Frequenzbasis zu transformieren. Die oben erwähnte MDCT-Transformation ist beschrieben in ICASSP, 1987, Subband/ Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation (Subband-/Transformationscodierung unter Heranziehung von Filterbankkonstruktionen auf der Grundlage einer Zeitbereichsfaltungsaufhebung), J. P. Princen, A. B. Bradley, Univ. of Surrey Royal Melbourne Inst. of Tech..
Durch Quantisieren von Signalen, die durch Filter- oder Spektrums-Transformationsverarbeitung auf diese Weise in die jeweiligen Bänder aufgeteilt sind, ist es möglich, die Bänder zu steuern, in denen Quantisierungsrauschen auftritt, und eine effizientere Codierung unter dem Gesichtspunkt des Gehörsinns vorzunehmen, indem von der Eigenschaft des Maskierungseffekts, etc. Gebrauch gemacht wird. Wenn in diesem Falle ein Vorgehen erfolgt, um eine Normierung der jeweiligen entsprechenden Bänder vorzunehmen, beispielsweise durch den Maximalwert von Absolutwerten der Signalkomponenten in den betreffenden entsprechenden Bändern vor der Ausführung einer Quantisierung, kann ferner eine effiziente Codierung vorgenommen werden.
Darüber hinaus wird als Verfahren zur Durchführung einer Frequenzbandaufteilung mit einer Frequenzaufteilungsbreite zur Quantisierung der betreffenden Frequenzkomponenten, die auf die jeweiligen Frequenzbänder aufgeteilt sind, eine Bandaufteilung vorgenommen, bei der beispielsweise die menschliche Hörsinncharakteristik berücksichtigt wird. Es gibt nämlich Beispiele, bei denen ein Audiosignal in Signalkomponenten ei ner Vielzahl (von beispielsweise 25) Bändern mit Bandbreiten derart aufgeteilt wird, dass die Bandbreiten entsprechend breiter werden, wenn sich die Frequenz zur höheren Frequenzbandseite hin verschiebt, die generell als kritische Bänder bezeichnet werden. Bei der Codierung von Daten der jeweiligen entsprechenden Bänder zu diesem Zeitpunkt wird eine Codierung durch eine bestimmte Bitzuweisung bezüglich der jeweiligen entsprechenden Bänder vorgenommen, oder es erfolgt eine Codierung durch eine adaptive Bitzuweisung bezüglich der jeweiligen entsprechenden Bänder. So wird beispielsweise bei der Codierung von Koeffizientendaten, die erhalten worden sind, nachdem die oben erwähnte MDCT-Verarbeitung durch die oben beschriebene Bitzuweisung erfolgt ist, eine Codierung durch adaptive Zuweisung von Bitzahlen in Bezug auf die MDCT-Koeffizientendaten bezüglich der jeweiligen entsprechenden Bänder durchgeführt, die durch die MDCT-Verarbeitung bezüglich der jeweiligen entsprechenden Blöcke erhalten worden sind.
Als Bitzuweisungsverfahren sind die folgenden beiden Verfahren bekannt. So wird beispielsweise gemäß IEEE Transactions of Acoustics, Speech, and Signal Processing, Vol. ASSP-25, Nr. 4, August 1977, eine Bitzuweisung nämlich auf der Basis der Größen von Signalen der jeweiligen entsprechenden Bänder durchgeführt. Gemäß diesem System wird das Quantisierungsrauschspektrum flach, und die Rauschenergie wird ein Minimum. Da ein Maskierungseffekt unter dem Gesichtspunkt des Gehörsinns nicht angewandt ist, ist jedoch die tatsächliche Rauschwahrnehmung nicht optimal.
Darüber hinaus ist beispielsweise in ICASSP 1980, The critical band coder – digital encoding of the perceptual requirements of the auditory system (Der kritische Bandcodierer – digitale Codierung der Wahrnehmungsanforderungen des Hörsystems), M. A. Kransner MIT, ein Verfahren beschrieben, bei dem die Gehörsinn-Maskierung ausgenutzt wird, um die notwendigen Signal-zu-Rausch-Verhältnisse bezüglich der jeweiligen entsprechenden Bänder zu erzielen, um eine feste Bitzuweisung vorzunehmen. Da bei dieser Technik bzw. bei diesem Verfahren die Bitzuweisung sogar in dem Fall festliegt, dass die Charakteristik mit einem Sinuswellen-Eingangssignal gemessen wird, kann der charakteristische Wert nicht einen so guten Wert annehmen.
Um diese Probleme zu lösen, ist in EP-0 525 809-A eine effiziente Codiervorrichtung vorgeschlagen worden, bei der sämtliche für eine Bitzuweisung verwendbaren Bits in dem Zustand genutzt werden, dass eine Aufteilung in Bits für ein festliegendes Bitzuweisungsmuster, das vorab für jeweils entsprechende kleine Blöcke bestimmt ist, und Bits zur Ausführung einer Bitzuweisung in Abhängigkeit von den Größen von Signalen entsprechender Blöcke erfolgt, um zu ermöglichen, dass deren Aufteilungsverhältnis von einem Signal in Bezug auf ein Eingangssignal abhängt, so dass das Aufteilungsverhältnis bezüglich der Bits für das festliegende Bitzuweisungsmuster entsprechend größer wird, wenn das Spektrum des Signals gleichmäßiger wird.
Gemäß diesem Verfahren wird in dem Fall, dass sich die Energien auf eine bestimmte Spektrumskomponente, wie ein Sinuswellen-Eingangssignal konzentrieren, eine größere Anzahl von Bits dem die betreffende Spektrumskomponente enthaltenden Block zugewiesen, wodurch es ermöglicht ist, die gesamte Störabstandscharakteristik merklich zu verbessern. Da der menschliche Gehörsinn generell extrem empfindlich ist für ein Signal mit einer scharfen Spektrumskomponente, führt die Verbesserung der Störabstandscharakteristik durch Anwendung eines derartigen Verfahrens nicht nur zu einer Verbesserung im numerischen Wert bei der Messung, sondern auch zu einer effektiven Verbesserung in der Schallqualität unter dem Gesichtspunkt des Gehörsinns.
Zusätzlich zu dem oben erwähnten Bitzuweisungsverfahren ist eine große Anzahl von Verfahren vorgeschlagen worden. Falls ein Modell bezüglich des Gehörsinns feiner gestaltet wird und die Fähigkeit der Codiervorrichtung verbessert wird, kann eine effizientere Codierung unter dem Gesichtspunkt des Gehörsinns vorgenommen werden.
Nunmehr wird unter Heranziehung von 12 und der nachfolgenden Zeichnungsfiguren eine konventionelle Signalcodierungsvorrichtung beschrieben. Gemäß 12 wird ein Akustiksignal bzw. eine akustische Signalwelle, die über einen Anschluss 100 zugeführt wird, durch eine Transformationsschaltung 101 in Signalfrequenzkomponenten transformiert. Sodann werden die betreffenden Komponenten durch eine Signalkomponenten-Codieräschaltung 102 codiert. Damit wird durch eine Codefolge-Erzeugungsschaltung 103 eine Codefolge erzeugt und von einem Anschluss 104 abgegeben.
Eine konkrete Konfiguration der Transformationsschaltung 101 gemäß 12 ist in 13 veranschaulicht. In 13 wird ein über einen Anschluss 200 (Signal über den Anschluss 100 gemäß 12) abgegebenes Signal in Signale von drei Frequenzbändern durch zwei Stufen von Bandaufteilungsfiltern 201, 202 aufgeteilt. Im Bandaufteilungsfilter 201 wird das über den Anschluss 200 zugeführte Signal derart ausgedünnt, dass es gleich eine Hälfte wird. Im Bandaufteilungsfilter 202 wird eines der durch das Bandaufteilungsfilter 201 auf eine Hälfte ausgedünnten Signale weiter ausgedünnt, so dass es gleich einer Hälfte wird (das Signal am Anschluss 200 wird derart ausgedünnt, dass es gleich zu einem Viertel wird). Die Bandbreiten der beiden Signale vom Bandaufteilungsfilter 202 betragen nämlich ein Viertel der Bandbreite des Signals vom bzw. am Anschluss 200.
Signale von entsprechenden Bändern, die in drei Bänder aufgeteilt werden bzw. sind, wie dies oben beschrieben worden ist, und zwar durch diese Bandaufteilungsfilter 201, 202, werden als Spektrumssignalkomponenten von den Spektrums-Transformationsschaltungen 203, 204, 205 herangezogen, um eine Spektrums-Transformationsverarbeitung, wie eine MDCT-Transformation, etc. durchzuführen. Die Ausgangssignale dieser Spektrums-Transformationsschaltungen 203, 204, 205 werden an die oben erwähnte Signalkomponenten-Codierschaltung 102 gemäß 12 abgegeben.
Eine konkrete Konfiguration der Signalkomponenten-Codierschaltung 102 gemäß 12 ist in 14 veranschaulicht.
In 14 wird ein einem Anschluss 300 zugeführtes Eingangssignal für die Signalkomponenten-Codierschaltung 102 veranlasst, sich einer Normierung bezüglich des jeweils bestimmten Bandes durch eine Normierungsschaltung 301 zu unterziehen, und es wird dann an eine Quantisierungsschaltung 303 abgegeben. Darüber hinaus wird das dem Anschluss 300 zugeführte Signal auch einer Quantisierungsgenauigkeits-Festlegungsschaltung bzw. Bestimmungsschaltung 302 zugeführt.
In der Quantisierungsschaltung 303 wird eine Quantisierung bezüglich des Signals von der Normierungsschaltung 301 auf der Grundlage der Quantisierungsgenauigkeit ausgeführt bzw. vorgenommen, die durch die Quantisierungsgenauigkeits-Festlegungsschaltung 302 aus dem Signal über den Anschluss 300 berechnet ist. Das Ausgangssignal von der Quantisierungsschaltung 303 wird vom Anschluss 304 abgegeben und an die Codefolge-Erzeugungsschaltung 103 gemäß 12 abgegeben. In dem Ausgangssignal vom Anschluss 304 sind eine Normierungs-Koeffizienteninformation in bzw. von der Normierungsschaltung 301 und eine Quantisierungsgenauigkeitsinformation in bzw. von der Quantisierungsgenauigkeits-Festlegungsschaltung 302 zusätzlich zu den Signalkomponenten enthalten, die durch die Quantisierungsschaltung 303 quantisiert werden bzw. sind.
Eine Darstellung des Aufbaus bzw. der Konfiguration einer Decodierungsvorrichtung, die imstande ist, ein akustisches Signal aus Codefolgen zu decodieren, welche durch die Codierungsvorrichtung mit dem Aufbau gemäß 12 erzeugt sind, um das decodierte Signal abzugeben, ist in 15 veranschaulicht.
Gemäß 15 werden Codes von entsprechenden Signalkomponenten durch eine Codefolge-Zerlegungsschaltung 401 aus der durch den Schaltungsaufbau gemäß 12 erzeugten Codefolge extrahiert ist, welche über den Anschluss 400 abgegeben ist. Durch die Signalkomponenten-Decodierschaltung 402 werden aus jenen Codes entsprechende Signalkomponenten wieder hergestellt (rekonstruiert). Danach wird eine inverse Transformationsverarbeitung entsprechend der Transformationsverarbeitung der Transformationsschaltung 101 gemäß 12 durch die Invers-Transformationsschaltung 403 ausgeführt bzw. implementiert. Somit wird das akustische Signal bzw. Wellensignal erhalten. Dieses akustische Signal wird vom Anschluss 404 abgegeben.
Eine konkrete Konfiguration bzw. ein konkreter Aufbau der Invers-Transformationsschaltung 403 gemäß 15 ist in 16 veranschaulicht.
Der Aufbau bzw. die Konfiguration gemäß 16 entspricht dem Beispiel des Aufbaus bzw. der Konfiguration der in 13 dargestellten Transformationsschaltung. Von der Signalkomponenten-Decodierschaltung 402 über Anschlüsse 501, 502, 503 gelieferte Signale werden durch Invers-Spektrums-Transformationsschaltungen 504, 505, 506 transformiert, um eine inverse Spektrums-Transformationsverarbeitung entsprechend der Spektrums-Transformationsverarbeitung gemäß 13 auszuführen. Signale entsprechender Bänder, die durch diese Invers-Spektrums-Transformationsschaltungen 504, 505, 506 erhalten werden, werden durch zwei Stufen von Bandsynthesefiltern 507, 508 synthetisiert.
Die Ausgangssignale der Invers-Spektrums-Transformationsschaltungen 505 und 506 werden nämlich zu dem Band-Synthesefilter 507 übertragen, in welchem sie synthetisiert werden. Ferner werden das Ausgangssignal des Band-Synthesefilters 507 und das Ausgangssignal der Invers-Spektrums-Transformationsschaltung 504 durch das Band-Synthesefilter 508 synthetisiert. Das Aus gangssignal dieses Band-Synthesefilters 508 wird vom Anschluss 509 (Anschluss 404 gemäß 15) abgegeben.
17 zeigt eine Darstellung zur Erläuterung eines Codierungsverfahrens, welches in der in 12 dargestellten Codiervorrichtung konventionell ausgeführt wird. Bei dem Beispiel gemäß 17 stellt das Spektrumssignal ein Signal dar, welches durch die Transformationsschaltung gemäß 13 erhalten wird. 17 veranschaulicht Pegel von Absolutwerten der Spektrumssignale (Signalkomponenten) durch eine MDCT-Transformation in dB-Werten.
In 17 wird ein Eingangssignal in 64 Spektrumssignale im jeweils bestimmten Zeitblock transformiert. Jene Spektrumssignale werden in Gruppen (nachstehend als Codierungseinheiten bezeichnet) von je fünf bestimmten Bändern kombiniert, die in 17 mit b1 bis b5 bezeichnet sind, und sie werden veranlasst, sich einer Normierung und Quantisierung zu unterziehen. Bei diesem Beispiel werden die Bandbreiten der betreffenden Codiereinheiten veranlasst, auf der unteren Frequenzbandseite schmal und auf der höheren Frequenzbandseite breit zu sein, so dass eine Steuerung bezüglich des Auftretens des Quantisierungsrauschens entsprechend der Eigenschaft des Gehörsinns durchgeführt werden kann.
Bei dem oben beschriebenen, konventionell angewandten Verfahren liegen die Bänder, in denen Frequenzkomponenten quantisiert werden, jedoch fest. Aus diesem Grunde müssen beispielsweise in dem Fall, dass sich die Spektrumskomponenten in den Bereichen in der Nähe von verschiedenen spezifischen Frequenzen konzentrieren, viele Bits einer großen Anzahl von Spektrumskomponenten zugewiesen werden, die zum selben Band wie dem jener Spektrumskomponenten gehören, falls versucht wird, jene Spektrumskomponenten mit ausreichender Genauigkeit zu quantisieren.
Wie aus der 17 hervorgeht, werden nämlich, wie oben erwähnt, dann, wenn eine Normierung in dem Zustand vorgenommen wird, in welchem Signale der jeweiligen bestimmten Bänder kombiniert werden, die Normierungskoeffizientenwerte auf der Basis eines großen Normierungskoeffizientenwertes normiert, der durch die Toncharakteristikkomponente bestimmt ist, beispielsweise im Frequenzband b3 in der betreffenden Zeichnungsfigur, in welchem die Toncharakteristikkomponente im Signal enthalten ist.
Zu dieser Zeit ist das im akustischen Signal der Toncharakteristik, bei der sich die Energien der Spektrumskomponenten auf eine spezifische bzw, bestimmte Frequenz oder auf Frequenzen konzentrieren, enthaltene Rauschen für das Ohr generell sehr offensiv im Vergleich zum Rauschen, das bei einem akustischen Signal zum Tragen kommen, bei dem die Energien über ein weites Frequenzband sanft verteilt sind und daher ein großes Hindernis unter dem Gesichtspunkt des Gehörsinns darstellen. Falls Spektrumskomponenten mit einer hohen Energie, das heißt die Toncharakteristikkomponenten nicht mit hinreichend guter Genauigkeit quantisiert werden bzw. sind, dann wird ferner in dem Fall, dass jene Spektrumskomponenten veranlasst werden, die Wellenformsignale auf der Zeitbasis für eine zweite Zeit zu sein, um sie mit Blöcken zuvor und danach zu synthetisieren, die Verzerrung zwischen den Blöcken groß, und es tritt eine starke Verbindungsverzerrung auf, wenn die Synthetisierung mit Wellenformsignalen benachbarter Zeitblöcke erfolgt, so dass sich auch ein starkes Hindernis unter dem Gesichtspunkt des Gehörsinns ergibt. Aus diesem Grunde muss zur Codierung der Toncharakteristikkomponenten eine Quantisierung mit einer hinreichend großen Anzahl von Bits vorgenommen werden. In dem Fall, dass die Quantisierungsgenauigkeiten für die jeweiligen bestimmten Frequenzbänder, wie oben beschrieben, bestimmt bzw. festgelegt sind, ist es jedoch notwendig, viele Bits einer großen Anzahl von Spektrumskomponenten innerhalb der Codiereinheiten zuzuweisen, die die Toncharakteristikkomponenten enthalten, um deren Quantisierung durchzuführen, was zu einem schlechten Codierungswirkungsgrad führt. Demgemäß war es in konventioneller Weise schwierig, den Wirkungsgrad der Codierung ohne Verschlechterung der Tonqualität zu verbessern, und zwar insbesondere im Hinblick auf akustische Signale der Toncharakteristik.
Typische Codierungs- und Decodierungsverfahren und -vorrichtungen, wie sie oben erörtert worden sind, sind in WO 89/10661-A1 und US 5.040.217 angegeben. Gemäß WO 89/10661-A1 werden gewisse Frequenzbänder überhaupt nicht genutzt, und es werden lediglich bestimmte andere Frequenzbänder auf einer Erfahrungs-Annahme hin kombiniert, ob jene Frequenzbänder eine wesentliche Information enthalten oder nicht. Gemäß US 5.040.217 (=EP 0 424 016 A2) werden eine MDCT-Transformation und eine variable Längencodierung in einem 1-Kanal-System angewandt, wobei Informationskomponenten, die als nicht wesentlich betrachtet werden, maskiert werden. Somit gehen sowohl mögliche wesentliche Informationen (Toncharakteristik) als auch Hintergrundinformationen (Rauschcharakteristik) verloren.
Offenbarung der Erfindung
Mit Rücksicht auf die obige Sachlage besteht eine Aufgabe der Erfindung darin, eine Signalcodierungsvorrichtung, mit der der Wirkungsgrad der Codierung verbessert werden kann, ohne eine Tonqualität eines insbesonderen akustischen Signals einer Toncharakteristik zuzulassen, sowie einen Aufzeichnungsträger, der so geeignet ist, dass durch eine derartige Signalcodierungsvorrichtung verarbeitete Signale darauf oder darin aufgezeichnet werden, und eine Signaldecodierungsvorrichtung bereitzustellen, die geeignet ist für die Decodierung eines codierten Signals, welches von einem derartigen Aufzeichnungsträger wiedergegeben ist oder welches von einer Signalcodierungsvorrichtung übertragen ist, wie sie oben erwähnt wurde.
Die diese Aufgaben lösende Erfindung ist in den unabhängigen Patentansprüchen angegeben. Weitere Merkmale sind in den abhängigen Patentansprüchen aufgeführt.
Hier führt die Signalcodierungsvorrichtung dieser Erfindung eine Verarbeitung durch, wie sie unten beschrieben ist. So ist nämlich die erste Codiereinrichtung derart betrieben, dass sie bei der Codierung des ersten Signals die Amplitudeninformation der betreffenden Toncharakteristikkomponenten des ersten Signals mit bzw. durch einen Normierungskoeffizienten normiert, woraufhin jene normierte Amplitudeninformation codiert wird. Darüber hinaus codiert diese Signalcodierungsvorrichtung entsprechende Frequenzkomponenten der betreffenden Toncharakteristikkomponenten nach einer Vielzahl von Transformationsregeln. Welche Regel der Vielzahl von Transformationsregeln bei der Ausführung der Codierung angewandt wird, wird durch die relative Positionsbeziehung auf der Frequenzbasis zwischen der maximalen Frequenzkomponente und entsprechenden Frequenzkomponenten der Toncharakteristikkomponenten bestimmt. Die auf die Maximalfrequenzkomponente angewandte Transformationsregel der oben erwähnten Transformationsregeln führt eine Transformationsverarbeitung zu kürzeren Codes im Hinblick auf Frequenzkomponenten durch, die über eine Information verfügen, welche eine größere Amplitudenwertinformation aufweist. Die bei den anderen Frequenzkomponenten der Maximalfrequenzkomponente angewandte Transformationsregel der oben erwähnten Transformationsregeln führt eine Transformationsverarbeitung zu kürzeren Codes im Hinblick auf Frequenzkomponenten durch, die über eine Information von geringerer Amplitudenwertinformation verfügen. In diesem Falle ist das Eingangssignal ein akustisches Signal.
Darüber hinaus normiert und quantisiert die erste Codiereinrichtung der Signalcodierungsvorrichtung gemäß dieser Erfindung die Amplitudeninformation der betreffenden Toncharakteristikkomponenten des ersten Signals mit bzw. durch Normierungskoeffizienten, um sie zu codieren, und sie lässt die Am plitudeninformation der Maximalfrequenzkomponente bei dieser Codierung weg.
Die Signalcodierungsvorrichtung gemäß dieser Erfindung führt in diesem Falle eine Verarbeitung durch, wie sie unten beschrieben ist. Die Trenn- bzw. Abtrenneinrichtung ermöglicht nämlich den Toncharakteristikkomponenten, sich auf der Frequenzbasis einander zu überlappen, um eine Abtrennung des ersten Signals vorzunehmen. Werte der Normierungskoeffizienten werden so festgelegt, dass demgemäß dann, wenn jene Werte kleiner werden, die Genauigkeit größer wird. Außerdem stellt auch in diesem Falle das Eingangssignal ein akustisches Signal dar.
Ein Aufzeichnungsträger dieser Erfindung bzw. gemäß dieser Erfindung ist derart geeignet, dass auf ihm oder in ihm ein Signal aufgezeichnet wird, bestehend Toncharakteristikkomponenten, die derart codiert sind, dass sie unterschiedliche Längen aufweisen, und dass auf ihm oder in ihm ein zweites Signal aufgezeichnet wird, das aus anderen Komponenten besteht.
Der Aufzeichnungsträger gemäß dieser Erfindung wird unten betrachtet. Die Amplitudeninformation von entsprechenden Toncharakteristikkomponenten des ersten Signals wird nämlich durch bzw. mittels Normierungskoeffizienten normiert und codiert. Darüber hinaus werden die betreffenden Frequenzkomponenten der Toncharakteristikkomponenten nach einer Vielzahl von Transformationsregeln codiert. Jede Regel der betreffenden Vielzahl von Transformationsregeln, die bei der Ausführung der Codierung angewandt wird, wird bzw. ist durch die relative Positionsbeziehung auf der Frequenzbasis zwischen der Maximalfrequenzkomponente und den betreffenden Frequenzkomponenten der Toncharakteristikkomponenten bestimmt. Die bei der maximalen Frequenzkomponente angewandte Transformationsregel der oben erwähnten Transformationsregeln führt eine Transformationsverarbeitung zu kürzeren Codes in Bezug auf die Frequenzkomponenten durch, die über eine Information von größeren Amplituden werten verfügen. Die auf anderen entsprechenden Frequenzkomponenten der maximalen Frequenzkomponente angewandte Transformationsregel der oben erwähnten Transformationsregeln führt eine Transformationsverarbeitung zu kürzeren Codes in Bezug auf Frequenzkomponenten mit einer Information durch, die geringere Amplitudenwerte aufweist. In diesem Falle ist das aufzuzeichnende Signal ein akustisches Signal.
Darüber hinaus ist ein Aufzeichnungsträger gemäß dieser Erfindung derart geeignet, dass ein erstes Signal, bestehend aus Toncharakteristikkomponenten, und ein zweites Signal, bestehend aus anderen Komponenten, in einer voneinander getrennten Weise aufgezeichnet werden. In diesem Falle werden durch Normierung und Quantisierung einer Amplitudeninformation der Toncharakteristikkomponenten des ersten Signals erhaltene Signale zu deren Codierung aufgezeichnet. Darüber hinaus werden Informationen mit Ausnahme der Informationen, die durch Normierung und Quantisierung der Amplitudeninformation der Maximalfrequenz erhalten werden, als erste Signale aufgezeichnet.
Hier wird eine Aufzeichnung in einer solchen Art und Weise vorgenommen, dass Toncharakteristikkomponenten des ersten Signals sich auf der Frequenzbasis einander überlappen. Normierungskoeffizienten für die Normierung werden so festgelegt, dass dementsprechend dann, wenn jene Werte kleiner werden, die Genauigkeit größer wird.
Eine Signaldecodierungsvorrichtung gemäß dieser Erfindung umfasst eine erste Decodiereinrichtung zum Decodieren eines ersten Signals, bestehend aus Toncharakteristikkomponenten, die so codiert sind, dass sie unterschiedliche Längen aufweisen, eine zweite Decodiereinrichtung zum Codieren eines zweiten Signals, welches andere Komponenten enthält, und eine Synthese-Invers-Transformationseinrichtung zum Synthetisieren der betreffenden Signale zu deren inverse Transformation oder zur inversen Transformation entsprechender Signale für deren Synthetisierung.
Die Signaldecodiervorrichtung dieser Erfindung wird unten ausgeführt. Die Amplitudeninformationen der betreffenden Toncharakteristikkomponenten des ersten Signals werden nämlich mittels Normierungskoeffizienten normiert, und sie werden codiert. Darüber hinaus werden die betreffenden Frequenzkomponenten der Toncharakteristikkomponenten nach einer Vielzahl von Transformationsregeln codiert. Jede Regel der betreffenden Vielzahl von Transformationsregeln, die bei der Ausführung der Codierung angewandt werden, wird durch die relative Positionsbeziehung auf der Frequenzbasis zwischen der Maximalfrequenzkomponente und dem betreffenden Frequenzkomponenten der Toncharakteristikkomponenten bestimmt. Die Transformationsregel, die auf die Maximalfrequenzkomponente aus den oben erwähnten Transformationsregeln angewandt ist, führt eine Transformationsverarbeitung zu kürzeren Codes in Bezug auf die Frequenzkomponenten mit Informationen von größeren Amplitudenwerten durch. Die Transformationsregel, die aus den oben erwähnten Transformationsregeln auf Komponenten, mit Ausnahme der Maximalfrequenzkomponente angewandt ist, führt eine Transformationsverarbeitung zu kürzeren Codes in Bezug auf Frequenzkomponenten mit Informationen von geringeren Amplitudenwerten durch. In diesem Fall stellt das Ausgangssignal ein akustisches Signal dar.
Überdies umfasst die Signaldecodierungsvorrichtung gemäß dieser Erfindung eine erste Decodiereinrichtung zum Decodieren eines ersten Signals, welches Toncharakteristikkomponenten enthält, die in dem Zustand codiert sind, in welchem eine Information ausgeschlossen ist, die durch Normierung und Quantisierung der Amplitudeninformation der Maximalfrequenzkomponenten erhalten wird, eine zweite Decodiereinrichtung zum Decodieren eines zweiten Signals, welches aus anderen bzw. weiteren Komponenten besteht, und eine Synthetisier-Invers-Transformationseinrichtung zum Synthetisieren der betreffenden Signale zu deren inverser Transformation oder zur inversen Transformation entsprechender Signale zu deren Synthetisierung.
In diesem Falle werden bzw. sind die Toncharakteristikkomponenten des ersten Signals in einem Zustand codiert, in welchem sie sich auf der Frequenzbasis einander überlappen. Zusätzlich sind die Normierungskoeffizienten für die Normierung so festgelegt, dass demgemäß dann, wenn jene Werte kleiner werden, die Genauigkeit größer wird.
Gemäß dieser Erfindung wird im Falle der Ausführung der Codierung bei einem eingangsseitigen Signal im Zustand der Aufteilung in Signalkomponenten (Toncharakteristikkomponenten), wobei sich die Energien auf eine bestimmte Frequenz und Komponenten konzentrieren (Komponenten mit Ausnahme der Toncharakteristikkomponenten), bei denen die Energien in einem breiten Frequenzband sanft bzw. leicht verteilt sind, eine Codierung mit einer variablen Länge effektiv auf Signale von Toncharakteristikkomponenten angewandt, wodurch eine effizientere Codierung realisiert wird. Im Hinblick auf einen Spektrumskoeffizienten, bei dem der absolute Wert ein Maximum ist, wobei beispielsweise lediglich die positive und negative Codeinformation codiert ist, wird dadurch überdies eine effizientere Codierung realisiert.
Kurze Beschreibung der Zeichnungen
1 zeigt ein Schaltungsdiagramm, in welchem in einer Blockform der Aufbau einer Codierungsvorrichtung gemäß einer Ausführungsform der Erfindung veranschaulicht ist.
2 veranschaulicht in einer Blockform ein Schaltungsdiagramm des Aufbaus einer Decodierungsvorrichtung gemäß der Ausführungsform der Erfindung.
3 veranschaulicht in einem Flussdiagramm den Verarbeitungsablauf in einer Signalkomponenten-Trennschaltung gemäß der Erfindung.
4 veranschaulicht in einer Ansicht die Abtrennung einer Toncharakteristikkomponente bei der Signalcodierung gemäß der Erfindung.
5 zeigt eine Darstellung zur Erläuterung einer Rauschcharakteristikkomponente, wobei Toncharakteristikkomponenten aus einem ursprünglichen Spektrumssignal bei der Signalcodierung gemäß der Erfindung entfernt sind.
6 zeigt eine Darstellung eines Beispiels eines Spektrumssignals.
7 zeigt in einer Ansicht ein Signal, das durch Codierung und Decodierung erhalten ist, und bei dem eine Toncharakteristikkomponente von dem Spektrumssignal gemäß 6 subtrahiert ist.
8 zeigt eine Darstellung zur Erläuterung einer Transformationsregel in Bezug auf das Spektrum von Toncharakteristikkomponenten bei der Erfindung.
9 veranschaulicht in einer Blockform ein Schaltungsdiagramm einer konkreten Konfiguration der Toncharakteristik-Codierschaltung gemäß 1.
10 veranschaulicht in einer Blockform ein Schaltungsdiagramm, welches eine konkrete Konfiguration der Toncharakteristik-Decodierschaltung gemäß 2 zeigt.
11 zeigt eine Ansicht zur Erläuterung der Aufzeichnung einer Codefolge, die erhalten wird, nachdem eine Codierung durch ein Signalcodierungssystem gemäß dieser Erfindung erfolgt ist.
12 veranschaulicht in einer Blockform ein Schaltungsdiagramm, welches den Aufbau einer konventionellen Codierungsvorrichtung zeigt.
13 veranschaulicht in einer Blockform ein Schaltungsdiagramm, welches einen konkreten Aufbau von Transformationsschaltungen gemäß diesem Ausführungsbeispiel und einer konventionellen Codierungsvorrichtung veranschaulicht.
14 veranschaulicht in einer Blockform ein Schaltungsdiagramm, welches einen konkreten Aufbau einer Signalkomponenten-Codierschaltung gemäß dieser Erfindung und einer konventionellen Codierungsvorrichtung zeigt.
15 zeigt in einer Blockform ein Schaltungsdiagramm, in welchem die Konfiguration der konventionellen Decodierungsvorrichtung veranschaulicht ist.
16 zeigt in einer Blockform ein Schaltungsdiagramm, welches eine konkrete Konfiguration von Invers-Transformationsschaltungen veranschaulicht, die bei der Erfindung und einer konventionellen Decodierungsvorrichtung angewandt sind.
17 zeigt eine Ansicht zur Erläuterung eines Codierverfahrens nach dem Stand der Technik.
18 zeigt in einer Blockform ein Schaltungsdiagramm unter Veranschaulichung eines weiteren Beispiels eines Synthese-Invers-Transformationsabschnitts, der eine Decodierungsvorrichtung gemäß der Erfindung darstellt.
19 zeigt in einer Blockform ein Schaltungsdiagramm einer weiteren Ausführungsform einer Codierungsvorrichtung gemäß dieser Erfindung.
20A veranschaulicht in einer Codetabelle eine Transformationsregel in Bezug auf einen Maximal-Spektrumskoeffizienten.
20B veranschaulicht in einer Codetabelle eine Transformationsregel von peripheren Spektrumskoeffizienten in dem Fall, dass dieselbe Transformationsregel in Bezug auf sämtliche peripheren Komponenten angewandt wird.
Beste Ausführungsform zur Ausführung der Erfindung
Nunmehr werden unter Bezugnahme auf die beigefügten Zeichnungen bevorzugte Ausführungsbeispiele dieser Erfindung beschrieben.
1 veranschaulicht die Grundzüge des Aufbaus einer Signalcodierungsvorrichtung gemäß einer Ausführungsform der Erfindung.
Gemäß 1 wird einem Anschluss 600 ein akustisches Wellenformsignal bzw. ein akustisches Signal zugeführt. Diese akustische Signalwellenform wird mittels einer Transformationsschaltung 601 in Signalfrequenzkomponenten transformiert und dann an eine Signalkomponenten-Trennschaltung 602 abgegeben.
In dieser Signalkomponenten-Trennschaltung 602 werden von der Transformationsschaltung 601 erhaltene Signalfrequenzkomponenten in Toncharakteristikkomponenten mit einer scharfen Spektrumsverteilung und in Signalfrequenzkomponenten mit Ausnahme der obigen Komponenten aufgeteilt, das heißt in eine Rauschcharakteristikkomponente mit einer flachen Spektrumsverteilung. Die Toncharakteristikkomponenten mit der scharfen Spektrumsverteilung von diesen abgetrennten Frequenzkomponenten werden durch eine Toncharakteristikkomponenten-Codierschaltung 603 codiert, und die Rauschcharakteristikkomponenten, die Signalfrequenzkomponenten mit Ausnahme der obigen Komponenten darstellen, werden durch eine Rauschcharakteristikkomponenten-Codierschaltung 604 codiert. Das von Toncharakteristikkomponenten-Codierschaltung 603 abgegebene Signal wird einer variablen Längencodierung in der eine variable Längencodierung vornehmenden Codierschaltung 610 unterzogen. Die Ausgangssignale der variablen Längencodierschaltung 610 und der Rauschcharakteristikkomponenten-Codierschaltung 604 werden einer Codefolgen-Erzeugungsschaltung 605 eingangsseitig zugeführt, in der eine Codefolge erzeugt wird. Die so erzeugte Codefolge wird von der betreffenden Schaltung abgegeben. Ein ECC-Codierer 606 fügt einen Fehlerkorrekturcode zu der Codefolge von der Codefolge-Erzeugungsschaltung 605 hinzu. Das Ausgangssignal von dem ECC-Codierer 606 wird durch eine EFM-Schaltung 607 moduliert. Das so erhaltene modulierte Signal wird an einen Aufzeichnungskopf 608 abgegeben. Dieser Aufzeichnungskopf 608 zeichnet die von der EFM-Schaltung 607 abgegebene Codefolge auf einer Platte 609 auf.
Es sei darauf hingewiesen, dass ein Aufbau entsprechend bzw. ähnlich dem von 13, wie oben erwähnt, als Transformationsschaltung 601 angewandt werden kann. Selbstverständlich kann man sich für den konkreten Aufbau der Transformationsschaltung 601 gemäß 1 eine große Anzahl von Konfigurationen vorstellen, allerdings mit Ausnahme der oben erwähnten Konfiguration gemäß 13. So kann das Eingangssignal beispielsweise direkt durch eine MDCT-Transformation in ein Spektrumssignal transformiert werden, und eine DFT- oder DCT-Transformation, etc. kann anstelle der MDCT-Transformation als Spektrumstransformationsverarbeitung angewandt werden.
Während ein Signal durch ein Bandaufteilungsfilter in Frequenzkomponentensignale aufgeteilt werden kann, wie dies zuvor beschrieben worden ist, ist überdies mit Rücksicht darauf, dass die Codierung gemäß der Erfindung insbesondere in dem Fall effektiv ausgeführt wird, in welchem Energien auf eine bestimmte Frequenz oder auf bestimmte Frequenzen konzentriert sind, die Anwendung eines Verfahrens zur Transformation in Frequenzkomponenten durch die oben beschriebene Spektrums-Transformationsverarbeitung zweckmäßig, durch die eine große Anzahl von Frequenzkomponenten mittels einer relativ kleinen Operationsgröße erzielt wird.
Ferner können die Toncharakteristikkomponenten-Codierschaltung 603 und die Rauschcharakteristikkomponenten-Codierschaltung 604 grundsätzlich durch einen Aufbau entsprechend jenem gemäß 14 realisiert werden, wie er oben erwähnt worden ist.
Andererseits zeigt 2 die Grundzüge des Aufbaus einer Signaldecodierungsvorrichtung gemäß der Ausführungsform der Erfindung zum Decodieren eines durch die Codierungsvorrichtung gemäß 1 codierten Signals.
In 2 wird eine von der Platte 609 mittels eines Wiedergabekopfes 708 wiedergegebene Codefolge an eine EF-Demodulationsschaltung 709 abgegeben (die mit Demodulation von EFM-Daten bezeichnet ist). Diese EF-Demodulationsschaltung 709 demoduliert die eingegebene Codefolge. Die demodulierte Codefolge wird an einen ECC-Decoder 710 abgegeben, in welchem eine Fehlerkorrektur vorgenommen wird. Eine Codefolgen-Zerlegungsschaltung 701 erkennt auf der Grundalge der Toncharakteristikkomponenteninformations-Nummer der fehlerkorrigierten Codefolge, welcher Teil der Codefolge zum Toncharakteristikkomponentencode gehört, um die eingegebene Codefolge in Toncharakteristikkomponentencodes und Rauschcharakteristikkomponentencodes aufzuteilen. Darüber hinaus trennt die Codefolge-Trennschaltung 701 die Positionsinformation der Toncharakteristikkomponente aus der eingegebenen Codefolge, um diese an eine Synthese- bzw. Synthetisierschaltung 704 der nachfolgenden Stufe anzugeben. Die Toncharakteristikkomponentencodes werden veranlasst, sich einer variablen Längendecodierung mittels der eine variable Längendecodierung vornehmenden Decodierungsschaltung 715 zu unterziehen, und sie werden dann an eine Toncharakteristikkomponenten-Decodierschaltung 702 abgegeben; die Rauschcharakterstikkomponentencodes werden an eine Rauschcharakteristikkomponenten-Decodierschaltung 703 abgegeben, wobei in den betreffenden Schaltungen eine inverse Quantisierung und eine Auflösung der Normierung vorgenommen und entsprechende Komponenten decodiert werden. Danach werden decodierte Signale von der Toncharakteristikkomponenten-Decodierschaltung 702 und der Rauschcharakteristikkomponenten-Decodierschaltung 703 an die Synthese- bzw. Synthetisierschaltung 704 abgegeben, und zwar zur Durchführung einer Synthese entsprechend der Aufteilung in der Signalkomponenten-Trennschaltung 602 gemäß 1. Die Syntheseschaltung 704 fügt das decodierte Signal der Toncharakteristikkomponente einer bestimmten Position des decodierten Signals der Rauschcharakteristikkomponente auf der Grundlage der Positionsinformation der Toncharakteristikkomponente hinzu, die von der Codefolge-Trennschaltung 701 geliefert ist, um dadurch eine Synthese auf der Frequenzbasis der Rauschcharakteristikkomponente und der Toncharakteristikkomponente durchzuführen. Ferner wird das so synthetisierte decodierte Signal veranlasst, sich einer inversen Transformationsverarbeitung in der Invers-Transformationsschaltung 705 zu unterziehen, um eine der Transformationsverarbeitung in der Transformationsschaltung 601 gemäß 1 entsprechende inverse Transformationsverarbeitung auszuführen, so dass ein Signal auf der Frequenzbasis veranlasst wird, das Originalsignal bzw. das Original-Wellensignal auf der Zeitbasis zum zweiten Mal zu sein. Das Ausgangswellenformsignal von der Invers-Transformationsschaltung 705 wird von einem Anschluss 707 abgegeben. Es sei darauf hingewiesen, dass die Verarbeitungsreihenfolge der inversen Transformation und der Synthese entgegengesetzt zu der obigen Reihenfolge sein kann. In diesem Falle ist der synthetische bzw. Synthese-Invers-Transformationsabschnitt 711 in 2 so aufgebaut, wie dies in 18 veranschaulicht ist. Die den Synthese-Invers-Transformationsabschnitt 711 bildende Invers-Transformationsschaltung 712 nimmt eine inverse Transformation des decodierten Signals der Rauschcharakteristikkomponente auf der Frequenzbasis von der Rauschcharakteristikkomponenten-Decodierschaltung 703 in ein Rauschcharakteristik-Komponentensignal auf der Zeitbasis vor. Die Invers-Transformationsschaltung 713 ordnet das decodierte Signal der Toncharakteristikkomponente von der Toncharakteristikkomponenten-Decodierschaltung 702 an einer Position auf der Frequenzbasis an, die durch die Positionsinformation der von der Codefolgen-Trennschaltung 701 für die inverse Transformation abgegebene Positionsinformation der Toncharakteristikkomponente bezeichnet ist, um ein Toncharakteristikkomponentensignal auf der Zeitbasis zu erzeugen. Die Syntheseschaltung 714 synthetisiert das Rauschcharakteristikkomponentensignal auf der Zeitbasis von der Invers-Transformationsschaltung 712 und das Toncharakteristikkomponentensignal auf der Zeitbasis von der Invers-Transformationsschaltung 713, um somit das Original-Wellenformsignal zu erzeugen.
Es sei darauf hingewiesen, dass der dem oben erwähnten Aufbau gemäß 16 entsprechende Aufbau für die Invers-Transformationsschaltungen 705, 712, 713 verwendet werden kann.
3 veranschaulicht den Ablauf einer tatsächlichen Verarbeitung zur Abtrennung der Toncharakteristikkomponente in der Signalkomponenten-Trennschaltung 602 der Codierungsvorrichtung gemäß 1.
In 3 ist mit I die Zahl bzw. Nummer von Spektrumssignalen bezeichnet, mit N ist die Gesamtzahl von Spektrumssignalen bezeichnet und mit P, R sind bestimmte Koeffizienten bezeichnet. Überdies wird die oben erwähnte Toncharakteristikkomponente auf der Grundlage folgender Berücksichtigung bestimmt. In dem Fall, dass der Absolutwert eines gewissen Spektrumssignals bei lokaler Betrachtung größer ist als andere Spektrumskomponenten, ist nämlich die Differenz zwischen dem Absolutwert und dem Maximalwert von absoluten Werten von Spektrumssignalen im entsprechenden Zeitblock (das ist der Block in der Spektrums-Transformationsverarbeitung) ein bestimmter Wert oder ein höherer Wert, und die Summe dieser Spektrums- und benachbarten Spektrumskomponenten (z. B. die Spektrumskomponenten, die in beiden Richtungen benachbart sind) gibt ein bestimmtes Verhältnis oder ein größeres Verhältnis in Bezug auf die Energie innerhalb eines bestimmten Bandes an, welches jene Spektrumskomponenten enthält. Dieses Spektrumssignal und beispielsweise dazu in beiden Richtungen benachbarte Spektrumssignale werden als Toncharakteristikkomponenten berücksichtigt. Es sei darauf hingewiesen, dass als ein bestimmtes Band für einen Vergleich des Verhältnisses der Energieverteilung ein Band angewandt werden kann, so dass die Bandbreite in einem unteren Frequenzband schmaler ist und in einem höheren Frequenzband beispielsweise entsprechend kritischen Bandbreiten breit ist, indem die Eigenschaft des Gehörsinns berücksichtigt wird.
In 3 wird zunächst beim Schritt S1 ein maximaler Spektrums-Absolutwert für die Variable AO gesetzt. Beim Schritt S2 wird die Zahl bzw. Nummer I des Spektrumssignals auf 1 gesetzt. Beim Schritt S3 wird ein bestimmter bzw. gewisser Spektrums-Absolutwert innerhalb eines gewissen Zeitblocks für die Variable A gesetzt.
Beim Schritt S4 wird entschieden, ob der Spektrums-Absolutwert der maximale Absolutwert des Spektrums, bei lokaler Betrachtung ist, der größer als andere Spektrumskomponenten ist oder nicht. Wenn als Ergebnis festgestellt wird, dass es nicht das maximale Absolutwert-Spektrum (NEIN) ist, dann geht die Verarbeitungsoperation weiter zum Schritt 510. Im Unterschied dazu geht die Verarbeitungsoperation zum Schritt S5 in dem Fall weiter, dass es sich um das maximale Absolutwert-Spektrum (JA) handelt.
Beim Schritt S5 wird das Verhältnis zwischen der Variablen A des maximalen Absolutwert-Spektrums entsprechend dem Zeitblock, der das maximale Absolutwert-Spektrum enthält, und der Variablen AO des maximalen Spektrums-Absolutwerts und dem Koeffizienten P, der eine bestimmte Größe anzeigt, verglichen (A/A_O > P). Als Ergebnis geht die Verarbeitungsoperation in dem Fall, dass A/A₀ größer ist als P (JA) weiter zum Schritt S6. Im Gegensatz dazu geht die Verarbeitungsoperation in dem Fall, dass A/A₀ kleiner ist als P (NEIN) weiter zum Schritt S10.
Beim Schritt S6 wird der Energiewert des Nachbarspektrums (beispielsweise die Summe der Energien der dem entsprechenden Spektrum in beiden Richtungen benachbarten Spektrumskomponenten) des Spektrums des Spektrums-Absolutwerts (maximales Absolutwert-Spektrum) ersetzt für die Variable X. Beim nachfolgenden Schritt S7 wird der Energiewert innerhalb eines bestimmten Bandes, welches das maximale Absolutwert-Spektrum und dessen benachbarte Spektren enthält, für die Variable Y eingesetzt.
Beim nachfolgenden Schritt S8 wird das Verhältnis zwischen der Variablen X des Energiewerts und der Variablen Y des Energie- werts innerhalb eines bestimmten Bandes und dem Koeffizienten R verglichen, das ein bestimmtes Verhältnis anzeigt (X/Y > R). Wenn als Ergebnis X/Y größer ist als R (JA), geht die Verarbeitungsoperation weiter zum Schritt S9. Wenn im Gegensatz dazu X/Y kleiner ist als R (NEIN), geht die Verarbeitungsoperation weiter zum Schritt 510.
Beim Schritt S9 werden in dem Fall, dass die Energie im maximalen Absolutwertspektrum und den dazu benachbarten Spektrumskomponenten ein bestimmtes oder größeres Verhältnis in Bezug auf die Energie innerhalb eines bestimmten Bandes anzeigt, welches jene Spektrumskomponenten enthält, das Signal seiner maximalen Absolutwert-Spektrumskomponente und beispielsweise Signale von dazu in beiden Richtungen benachbarten Spektrumskomponenten als Toncharakteristikkomponente betrachtet, um diesen Umstand zu registrieren.
Beim nachfolgenden Schritt S10 wird entschieden, ob die Nummer bzw. Zahl I des beim Schritt S9 registrierten Spektrumssignals und die Gesamtzahl N der Spektrumssignale einander gleich sind (I = N) oder nicht. Als Ergebnis wird in dem Fall, dass die betreffenden Signale einander gleich sind (JA), die Verarbeitung beendet. Im Gegensatz dazu geht die Verarbeitungsoperation in dem Fall, dass die betreffenden Signale nicht einander gleich sind (NEIN), weiter zum Schritt 511. Bei diesem Schritt S11 wird I festgelegt auf I = I + 1, um die Nummer bzw. Zahl der Spektrumssignale um 1 zu erhöhen (zu inkrementieren). Damit kehrt die Verarbeitungsoperation zum Schritt S3 zurück, um die oben erwähnte Verarbeitung zu wiederholen. Die Signalkomponenten-Trennschaltung 602 gibt eine Frequenzkomponente oder Frequenzkomponenten, bezüglich der durch die oben beschriebene Verarbeitung entschieden ist, dass es die Toncharakteristikkomponente ist, an die Toncharakteristik-Codierschaltung 603 ab, und die betreffende Schaltung gibt andere Frequenzkomponenten als Rauschcharakteristikkomponente an die Rauschcharakteristikkomponenten-Codierschaltung 604 ab. Darüber hinaus gibt die Signalkomponenten-Trennschaltung 602 die Nummer bzw.
Zahl der Frequenzinformation, die als Toncharakteristikkomponente entschieden ist, und eine Information über die betreffende Position an die Codefolgen-Erzeugungsschaltung 605 ab.
4 veranschaulicht den Zustand eines Beispiels, bei dem Toncharakteristikkomponenten aus Frequenzkomponenten in einer Weise getrennt sind, wie dies oben beschrieben worden ist.
Bei dem in 4 dargestellten Beispiel sind vier Toncharakteristikkomponenten extrahiert, die in der betreffenden Figur mit TC_A, TC_B, TC_C, TC_D bezeichnet sind. Da diese Toncharakteristikkomponenten in dem Zustand, in welchem sie auf eine kleine Anzahl von Spektrumssignalen, wie beim Beispiel gemäß 4, verteilt sind, ist sogar dann, wenn diese Komponenten mit einer guten Genauigkeit quantisiert werden bzw. sind, eine große Anzahl von Bits insgesamt nicht so erforderlich. Während danach die Toncharakteristikkomponenten einmal normiert werden, um die normierten Komponenten zu quantisieren und um den Codierungswirkungsgrad zu verbessern, können daher mit Rücksicht darauf, dass die Spektrumssignale, welche die Toncharakteristikkomponente bilden, in der Anzahl relativ klein sind, die Verarbeitung der Normierung und/oder die Requantisierung weggelassen werden bzw. entfallen, womit die Vorrichtung bzw. Anordnung vereinfacht ist.
Unterdessen veranschaulicht 5 das Beispiel, bei dem Rauschcharakteristikkomponenten gezeigt sind, in denen Toncharakteristikkomponenten aus dem ursprünglichen Spektrumssignal entfernt sind.
Wie in 5 gezeigt, sind die Toncharakteristikkomponenten, wie oben beschrieben, aus dem ursprünglichen Spektrumssignal in den Bändern b1 ~ b5 entfernt (veranlasst dazu, Null zu sein). In diesem Falle werden die Normierungskoeffizienten in den betreffenden Codierungseinheiten zu einem kleinen Wert. Demgemäß kann erzeugtes Quantisierungsrauschen sogar mit einer kleinen Anzahl von Bits verringert werden.
Während beschrieben worden ist, dass eine Lösung angewandt wird, um die Toncharakteristikkomponente abzutrennen, damit ermöglicht ist, dass die Toncharakteristikkomponenten und die Signalkomponenten in deren Nähe danach zu Null werden, um die Rauschcharakteristikkomponenten zu codieren, ist es dadurch ermöglicht, eine effiziente Codierung zu realisieren. Dabei kann ein Verfahren zum Codieren von Signalkomponenten angewandt werden, die durch Subtrahieren eines Signals erhalten werden, welches aus der Codierung von Toncharakteristikkomponenten erhalten wird, um jene Komponenten von dem ursprünglichen Spektrumssignal zu decodieren.
Eine nach diesem Verfahren arbeitende Signalcodiervorrichtung wird nunmehr unter Bezugnahme auf 19 beschrieben. Es sei darauf hingewiesen, dass dieselben Bezugszeichen denselben Komponenten wie jenen in 1 gegeben sind und dass ihre Erläuterung weggelassen wird.
Das Spektrumssignal, welches von der Transformationsschaltung 601 erhalten wird, wird an eine Toncharakteristikkomponenten-Extrahierschaltung 802 über einen Schalter 801 abgegeben, der von einer Steuerschaltung 808 gesteuert wird. Diese Toncharakteristikkomponenten-Extrahierschaltung 802 diskriminiert die Toncharakteristikkomponente durch die oben beschriebene Verarbeitung gemäß 3, um lediglich die diskriminierte Toncharakteristikkomponente an die Toncharakteristikkomponenten-Codierschaltung 603 abzugeben. Überdies gibt die Toncharakteristikkomponenten-Extrahierschaltung 802 die Nummer bzw. Zahl der Toncharakteristikkomponenteninformation und deren Mittenpositionsinformation an die Codefolge-Erzeugungsschaltung 605 ab. Die Toncharakteristikkomponenten-Codierschaltung 603 führt eine Normierung und Quantisierung bezüglich der eingegebenen Toncharakteristikkomponente aus, um die normierte und quantisierte Toncharakteristikkomponente an die eine variable Längencodierung vornehmende Codierschaltung 610 und an einen lokalen Decoder 804 abzugeben. Diese eine variable Längencodie rung vornehmende Codierschaltung 610 führt eine variable Längencodierung bezüglich der normierten und quantisierten Toncharakteristikkomponente aus, um den so erhaltenen variablen Längencode an die Codefolgen-Erzeugungsschaltung 605 abzugeben. Dieser lokale Decoder 804 führt eine inverse Quantisierung und Aufhebung der Normierung bezüglich der normierten und quantisierten Toncharakteristikkomponente aus, um das Signal der ursprünglichen Toncharakteristikkomponente zu decodieren. Es sei darauf hingewiesen, dass Quantisierungsrauschen im decodierten Signal zu diesem Zeitpunkt enthalten wäre. Das Ausgangssignal vom lokalen Decoder 804 wird einem Addierer 805 als erstes decodiertes Signal zugeführt. Darüber hinaus wird das ursprüngliche Spektrumssignal von der Transformationsschaltung 601 dem Addierer 805 über den Schalter 806 zugeführt, der durch die Schalter-Steuerschaltung 808 gesteuert wird. Dieser Addierer 805 subtrahiert das erste decodierte Signal von dem ursprünglichen bzw. Original-Spektrumssignal, um das erste Differenzsignal abzugeben. In dem Fall, dass die Verarbeitungsfolge des Extrahierens, Codierens, Decodierens, der Differenzbestimmung der Toncharakteristikkomponente durch lediglich eine Verarbeitungsfolge abgeschlossen wird, wird das oben erwähnte erste Differenzsignal als Rauschcharakteristikkomponente an die Rauschcharakteristikkomponenten-Codierschaltung 604 über einen Schalter 807 abgegeben, der durch die Schalter-Steuerschaltung 808 gesteuert wird. Darüber hinaus wird die Verarbeitungsfolge des Extrahierens, Codierens, Decodierens, der Differenzbestimmung der Toncharakteristikkomponente wiederholt, und das erste Differenzsignal wird über den Schalter 801 an die Toncharakteristikkomponenten-Extrahierschaltung 802 abgegeben. Die Toncharakteristikkomponenten-Extrahierschaltung 802, die Toncharakteristikkomponenten-Codierschaltung 603 und der lokale Decoder 804 führen eine der obigen Verarbeitung entsprechende bzw. ähnliche Verarbeitung aus. Damit wird das zweite erhaltene decodierte Signal an den Addierer 805 abgegeben. Überdies wird das erste Differenzsignal dem Addierer 805 über den Schalter 806 zugeführt. Der Addierer 805 subtrahiert das zweite decodierte Signal von dem ersten Differenzsignal, um das zweite Differenzsignal abzugeben. Ferner wird in dem Fall, dass die Verarbeitungsfolge des Extrahierens, Codierens, Decodierens, der Differenzbestimmung der Toncharakteristikkomponente durch zweimalige Verarbeitungsfolge abgeschlossen wird, das zweite Differenzsignal an die Rauschcharakteristikkomponenten-Codierschaltung 804 über den Schalter 807 als Rauschcharakteristikkomponente abgegeben. In dem Fall, dass die Verarbeitungsfolge des Extrahierens, Codierens, Decodierens, der Differenzbestimmung der Toncharakteristikkomponente weiterhin wiederholt wird, wird eine der oben beschriebenen Verarbeitung entsprechende bzw. ähnliche Verarbeitung durch die Toncharakteristikkomponenten-Extrahierschaltung 802, die Toncharakteristikkomponenten-Codierschaltung 603, den lokalen Decoder 804 und den Addierer 805 ausgeführt. Die Schalter-Steuerschaltung 808 hält den Schwellwert der Toncharakteristikkomponenten-Informationszahl fest und steuert den Schalter 807 so, dass die Extrahierung, die Codierung, die Decodierung und die Differenzbestimmung der Verarbeitungsfolge der Toncharakteristikkomponente in dem Fall abgeschlossen wird, dass die von der Toncharakteristikkomponenten-Extrahierschaltung erhaltene Toncharakteristikkomponenten-Informationszahl oberhalb des Schwellwertes liegt. Darüber hinaus kann in der Toncharakteristikkomponenten-Codierschaltung 603 eine derartige Verarbeitung angewandt werden, dass dann, wenn das Extrahieren der Toncharakteristikkomponente aufhört, die Extraktion, Codierung, Decodierung und Differenzbestimmungs-Verarbeitungsfolge der Toncharakteristikkomponente abgeschlossen wird bzw. ist.
6 und 7 zeigen Darstellungen zur Erläuterung eines derartigen Verfahrens, wobei 7 ein Signal zeigt, in welchem ein durch Codieren einer Toncharakteristikkomponente erhaltenes Signal zur Decodierung des codierten Signals von dem Spektrumssignal gemäß 6 subtrahiert ist.
Darüber hinaus werden in der Figur durch gestrichelte Linien bezeichnete Komponenten ferner aus dem Spektrumssignal gemäß
7 als Toncharakteristikkomponente extrahiert, wodurch ermöglicht wird, die Codierungsgenauigkeit des Spektrumssignals zu verbessern. Durch Wiederholen einer derartigen Operation kann eine Codierung mit hoher Genauigkeit ausgeführt werden. In dem Fall, dass dieses Verfahren angewandt wird, kann sogar dann, wenn die obere Grenze der Anzahl der Bits für die Quantisierung der Toncharakteristikkomponente auf einen niedrigen Wert festgelegt ist, die Codierungsgenauigkeit hinreichend hoch sein. Demgemäß liegt hier auch der Vorzug bzw. Verdienst vor, dass die Anzahl der Bits für die Aufzeichnungsquantisierungsbitanzahl verringert werden kann. Ferner kann das in einer mehrstufigen Weise, wie oben ausgeführt, ablaufende Verfahren zum Extrahieren von Toncharakteristikkomponenten notwendigerweise nicht nur in dem Fall angewandt werden, in dem ein Signal, welches einem Signal äquivalent ist, das durch Codieren der Toncharakteristikkomponente erhalten wird, um das codierte Signal zu decodieren, von dem Original-Spektrumssignal subtrahiert wird, sondern auch in dem Fall, in welchem ein Spektrumssignal der extrahierten Toncharakteristikkomponente zu Null gemacht wird. Bei der Beschreibung dieser Erfindung sollte die Angabe bzw. der Ausdruck, dass "ein Signal, aus dem die Toncharakteristikkomponenten abgetrennt sind", etc. als Angabe bzw. Begriff betrachtet werden, die bzw. der die oben erwähnten beiden Fälle einschließt.
Während in der Codiervorrichtung dieser Ausführungsform, wie oben beschrieben, das Original-Wellenformsignal in Toncharakteristikkomponenten und Rauschcharakteristikkomponenten zerlegt wird, um eine Codierung auszuführen, wodurch eine effizientere Codierung realisiert wird, wird ein Verfahren, wie es unten beschrieben ist, in Verbindung mit der Codierung der Toncharakteristikkomponenten angewandt, um dadurch die Durchführung einer noch effizienteren Codierung zu ermöglichen.
Im Hinblick auf die betreffenden Toncharakteristikkomponenten konzentrieren sich nämlich Energien auf einen Spektrumskoeffizienten, bei dem der Absolutwert ein Maximum wird (der nach stehend als Maximal-Spektrumskoeffizient bezeichnet wird), und auf periphere Spektrumskoeffizienten (die nachstehend als periphere Spektrumskoeffizienten bezeichnet werden). In diesem Falle tritt irgendeine Abweichung in der Teilung der Werte auf, wenn die betreffenden Koeffizienten quantisiert werden, und der Zustand (Art und Weise) der Verteilung des maximalen Spektrumskoeffizienten und jener der peripheren Spektrumskoeffizienten sind stark voneinander verschieden, und zwar in Abhängigkeit von der relativen Positionsbeziehung der Frequenzbasis. Falls die die betreffenden Tonkomponenten darstellenden Spektrumskoeffizienten durch den Normierungskoeffizienten normiert werden, der durch den maximalen Spektrumskoeffizienten bestimmt ist, das heißt wenn die die Toncharakteristikkomponenten bildenden entsprechenden Spektrumskoeffizienten durch den maximalen Spektrumskoeffizienten in jene Toncharakteristikkomponenten aufgeteilt sind, dann wird nämlich der maximale Spektrumskoeffizient nach der Quantisierung gleich einem Wert, der näher bei +1 oder –1 liegt. Im Gegensatz dazu werden mit Rücksicht darauf, dass die Tonkomponenten mit der Charakteristik, gemäß der die Spektrumskoeffizienten hauptsächlich abrupt bei in einer Mitte liegendem maximalen Spektrumskoeffizienten abnehmen, die peripheren Spektrumskoeffizienten nach der Quantisierung bei einer höheren Frequenz bei Werten näher bei Null verteilt.
In dem Fall, dass irgendeine Abweichung in der Verteilung der zu codierenden Werte vorliegt, wie oben erwähnt, wird ein sogenannter variabler Längencode angewandt, um eine kürzere Codelänge dem Muster hoher Frequenz zuzuordnen, wie dies beispielsweise beschrieben ist von D. A. Huffman: A Method for Construction of Minimum Redundancy Codes (Ein Verfahren zur Bildung von Codes minimaler Redundanz), Proc. I.R.E., 40, Seite 1098 (1952), wodurch es ermöglicht ist, eine effiziente Codierung auszuführen.
Angesichts der obigen Ausführungen werden in der Signalcodierungsvorrichtung gemäß der Ausführungsform dieser Erfindung die betreffenden Toncharakteristikkomponenten in einen maximalen Spektrumskoeffizienten und in periphere Spektrumskoeffizienten aufgeteilt, um unterschiedliche variable Längencodes auf die betreffenden Spektrumskoeffizienten anzuwenden, damit eine effiziente Codierung realisiert wird.
Es sei darauf hingewiesen, dass mit Rücksicht darauf, dass die Toncharakteristikkomponenten eine sehr scharfe Spektrumsverteilung auf der Frequenzbasis besitzen, die Verteilung der Werte in dem Fall, dass die peripheren Spektrumskoeffizienten normiert und quantisiert sind, stark durch die relative Positionsbeziehung auf der Frequenzbasis zwischen jenen peripheren Spektrumskoeffizienten und dem maximalen Spektrumskoeffizienten beeinflusst wird. Mit Rücksicht hierauf ist es erwünscht, ein Vorgehen zur weiteren Klassifizierung (Unterteilung) von peripheren Spektrumskoeffizienten in verschiedene Sätze (Gruppen) in Abhängigkeit von der relativen Position auf der Frequenzbasis in Bezug auf den maximalen Spektrumskoeffizienten anzuwenden, um sie nach Transformationsregeln in unterschiedliche variable Längencodes der jeweiligen unterteilten Sätze (Gruppen) zu transformieren.
Als Verfahren zur Klassifizierung der relativen Position kann ein Verfahren zur Durchführung einer Klassifikation nach Absolutwerten der Differenz auf der Frequenzbasis in Bezug auf die maximalen Spektrumskoeffizienten angewandt werden.
In Bezug auf das beispielsweise in 8 dargestellte Spektrum der Toncharakteristikkomponenten werden nämlich insgesamt drei Transformationsregeln angewandt, die Transformationsregel in Bezug auf den maximalen Spektrumskoeffizienten, der in der Figur mit ECc bezeichnet ist, die Transformationsregel in Bezug auf die peripheren Spektrumskoeffizienten, die in der Figur mit ECb und ECd bezeichnet sind, und die Transformationsregel in Bezug auf die peripheren Spektrumskoeffizienten, die in der Figur mit ECa und ECe bezeichnet sind, um eine Transformationsverarbeitung zu variablen Längencodes auszuführen.
Selbstverständlich kann die variable Längencodierung nach derselben Transformationsregel in Bezug auf sämtliche peripheren Spektrumskoeffizienten zum Zwecke der Vereinfachung der Verarbeitung ausgeführt werden.
Ein Beispiel einer Codetabelle, welche die Transformationsregel in Bezug auf den maximalen Spektrumskoeffizienten veranschaulicht, ist in 20A dargestellt. Darüber hinaus ist ein Beispiel einer Codetabelle, die die Transformationsregel der peripheren Spektrumskoeffizienten in dem Fall veranschaulicht, dass dieselbe Regel in Bezug auf sämtliche peripheren Spektrumskoeffizienten angewandt wird, in 20B veranschaulicht.
Der maximale Spektrumskoeffizient nach der Normierung und Quantisierung, das heißt der quantisierte Wert des maximalen Spektrums ist gleich einem Wert, der näher bei +1 oder –1 liegt, wie dies oben beschrieben worden ist. Somit ist es, wie in 20A veranschaulicht, dann, wenn 00 und 01 Codes mit Codelängen sind, die kürzer sind als Codelängen, die anderen Werten zugewiesen sind, möglich, den maximalen Spektrumskoeffizienten effizient zu codieren.
Darüber hinaus werden periphere Spektrumskoeffizienten nach der Normierung und Quantisierung, das heißt die quantisierten Werte der peripheren Spektrumskomponenten gleich einem Wert, der näher bei Null liegt, wie dies oben beschrieben worden ist. Somit ist es, wie in 20 veranschaulicht, in dem Fall, dass 0, der eine Codelänge besitzt, die kürzer ist als die Codelängen, die anderen Werten zugewiesen sind, der oben erwähnten 0 (Null) zugewiesen ist, möglich, die peripheren Spektrumskoeffizienten effizient zu codieren.
Falls eine Vielzahl von Codetabellen bezüglich der maximalen Spektrumskomponenten und eine Vielzahl von Codetabellen bezüglich der peripheren Spektrumskoeffizienten mit der jeweiligen Quantisierungsgenauigkeit vorgesehen sind, die in der Toncha rakteristikkomponenten-Codierschaltung 603 festgelegt ist, um eine entsprechende Codetabelle in Übereinstimmung mit der festgelegten bzw. bestimmten Quantisierungsgenauigkeit auszuwählen, dann kann ferner eine effizientere Codierung durchgeführt werden.
9 zeigt ein konkretes Beispiel der eine variable Längencodierung vornehmenden Codierschaltung 610 gemäß 1.
Gemäß 9 werden die dem Anschluss 800 eingangsseitig zugeführten Toncharakteristikkomponenten durch die relative Position auf der Frequenzbasis in Bezug auf die maximale Spektrumskomponente durch die Steuerschaltung 801 klassifiziert (aufgeteilt). Die so klassifizierten Spektrumskomponenten werden an die Maximal-Spektrumskoeffizienten-Codierschaltung 802, die periphere Spektrumskoeffizienten-Codierschaltung 803 und die dieser entsprechende periphere Spektrumskoeffizienten-Codierschaltung 804 abgegeben In diesen betreffenden Schaltungen werden jene Spektrumskomponenten auf der Basis der oben beschriebenen entsprechenden Transformationsregeln codiert. Die codierten Ausgangssignale von den betreffenden Codierschaltungen 802, 803, 804 werden durch die Steuerschaltung 801 vom Ausgangsanschluss 805 abgegeben.
10 zeigt ein konkretes Beispiel der oben beschriebenen, eine variable Längendecodierung vornehmenden Decodierschaltung 715 gemäß 2.
Gemäß 10 werden die dem Eingangsanschluss 900 eingangsseitig zugeführten Toncharakteristikkomponentencodes entsprechend der Klassifikation von 9 klassifiziert. Die so klassifizierten Codes werden an die Maximal-Spektrumskoeffizienten-Decodierschaltung 902, die periphere Spektrumskoeffizienten-Decodierschaltung 903 und die dieser entsprechende periphere Spektrumskoeffizienten-Decodierschaltung 904 abgegeben. In diesen betreffenden Schaltungen werden jene Codes auf der Grundlage von inversen Transformationsregeln decodiert, die den oben beschriebenen Transformationsregeln entsprechen. Die decodierten Ausgangssignale von den betreffenden Decodierschaltungen 902, 903, 904 werden vom Ausgangsanschluss 905 durch die Steuerschaltung 901 abgegeben.
11 zeigt ein Beispiel für den Fall, dass das Spektrumssignal gemäß 4 durch die Codierungsvorrichtung dieser Ausführungsform codiert wird bzw. ist. Die so erhaltenen Codefolgen werden auf einem Aufzeichnungsträger aufgezeichnet.
Bei diesem Beispiel wird die Toncharakteristikkomponenten-Information Nr. tnc (z. B. 4 beim Beispiel gemäß 11) zuerst auf dem Aufzeichnungsträger aufgezeichnet. Sodann werden die Toncharakteristikkomponenteninformation tc_A, tc_B, tc_C, tc_D und die Rauschcharakteristikkomponenteninformation nc₁, nc₂, nc₃, nc₄, nc₅ in der aufgeführten Reihenfolge aufgezeichnet. In der Toncharakteristikkomponenteninformation tc_A, tc_B, tc_C, tc_D werden die Mittenpositionsinformation CP, welche die Position der Mitte des Spektrums der Toncharakteristikkomponente angibt (z. B. 15 im Falle beispielsweise der Toncharakteristikkomponente tc_B), eine Quantisierungsgenauigkeitsinformation, welche die Anzahl der Bits für die Quantisierung angibt (z. B. 6 im Falle beispielsweise der Toncharakteristikkomponente tc_B) und eine Normierungskoeffizienteninformation zusammen mit einer entsprechenden Signalkomponenteninformation SC_a, SC_b, SC_c, SC_d, SC_e aufgezeichnet, die veranlasst waren, sich einer Normierung und Quantisierung zu unterziehen. Sodann werden die betreffenden Signalkomponenteninformationen veranlasst, sich einer variablen Längencodierung zu unterziehen. Bei diesem Beispiel werden die Transformationsregeln der variablen Längencodierung bezüglich der jeweiligen Quantisierungsgenauigkeit vorab festgelegt. Die Decodierungsvorrichtung führt eine Decodierung von variablen Längencodes dadurch aus, dass auf die Quantisierungsgenauigkeitsinformation Bezug genommen wird.
Hier ist es z. B. in solchen Fällen, in denen die Quantisierungsgenauigkeit durch die Frequenz fest vorgegeben bzw. be stimmt ist, selbstverständlich unnötig, eine Quantisierungsgenauigkeitsinformation aufzuzeichnen. Während beim oben beschriebenen Ausführungsbeispiel die Position der Mittenspektrumskomponente der betreffenden Toncharakteristikkomponenten als Positionsinformation der Toncharakteristikkomponenten verwendet wird, ist darauf hinzuweisen, dass die Position der Spektrumskomponente des untersten Frequenzbandes der betreffenden Toncharakteristikkomponenten (z. B. 14 im Falle der Toncharakteristikkomponente TC_B) aufgezeichnet werden bzw. sein kann.
Überdies werden in Bezug auf die Rauschcharakteristikkomponenteninformation eine Quantisierungsgenauigkeitsinformation (z. B. 2 im Falle der Rauschcharakteristikkomponente nc₁) und eine Normierungskoeffizienteninformation zusammen mit der normierten und quantisierten Signalkomponenteninformation SC₁, SC₂, ... SC₈ aufgezeichnet.
In dem Fall, dass die Quantisierungsgenauigkeitsinformation Null ist, wird hier eine Codierung in der betreffenden Codiereinheit tatsächlich nicht ausgeführt. In dem Fall, dass die Quantisierungsgenauigkeit je Band entsprechend dem obigen fest vorgegeben bzw. bestimmt ist, ist es unnötig, eine Quantisierungsgenauigkeitsinformation aufzuzeichnen.
11 zeigt das Ausführungsbeispiel der Art und Reihenfolge der auf einem Aufzeichnungsträger aufgezeichneten Informationen. So sind beispielsweise die Informationen bis zu der Signalkomponenteninformation SC_a, SC_b, SC_c, SC_d, SC_e Codes von variabler Länge, und deren Längen sind nicht fest.
Die Signalcodierungsvorrichtung dieser Ausführungsform verfügt über eine Fähigkeit, in Bezug auf die maximale Spektrumskomponente der betreffenden Toncharakteristikkomponenten ihre Amplitudeninformation lediglich durch Normierung der Koeffizienteninformation bereitzustellen, um die Ausführung einer effizienteren Codierung zu ermöglichen. Die Toncharakteristik- bzw. Toncharakteristikkomponenten-Codierschaltung 603 führt nämlich eine Normierung und Quantisierung in Bezug auf Frequenzkomponenten mit Ausnahme der maximalen Spektrumskomponente der betreffenden Toncharakteristikkomponenten durch. Es sei darauf hingewiesen, dass daher ein Aufbau bzw. eine Konfiguration angewandt werden kann, bei dem bzw. der die Normierung und Quantisierung in Bezug auf sämtliche betreffenden Toncharakteristikkomponenten einschließlich des maximalen Spektrums in der Toncharakteristikkomponenten-Codierschaltung 603 ausgeführt werden, und der quantisierte Wert entsprechend dem maximalen Spektrum wird nicht an der Codefolge-Erzeugungsschaltung 605 der nachfolgenden Stufe abgegeben. In dem Fall, dass eine derartige Codierung ausgeführt wird, enthält die Signalkomponenteninformation SC_c lediglich Codes, die beim Beispiel gemäß 11 eine positive und negative Anzeige liefern.
Da der Wert ungefähr der Amplitudeninformation des maximalen Spektrums hauptsächlich als Normierungskoeffizient ausgewählt wird, ist es hier in dem Fall, dass Normierungskoeffizienten auf einem Aufzeichnungsträger aufgezeichnet werden bzw. sind, möglich, ungefähre Werte der Amplitudeninformation des maximalen Spektrums aus jenen Normierungskoeffizienten zu erhalten. In dem Fall, dass beispielsweise die Spektrumsinformation durch eine MDCT- oder durch eine DCT-Transformation, etc. realisiert wird, kann demgemäß der ungefähre Wert des maximalen Spektrums aus Codes, die Positives und Negatives anzeigen, und aus der Normierungskoeffizienteninformation erhalten werden. In dem Fall, dass beispielsweise die Spektrumsinformation durch eine DFT-Transformation, etc. realisiert ist, kann überdies der ungefähre Wert des maximalen Spektrums allein aus einer Phasenkomponente erhalten werden. Damit kann die Aufzeichnung der durch Quantisieren der Amplitudeninformation in Bezug auf das maximale Spektrum erhaltenen Information entfallen. Dieses Verfahren ist besonders effektiv in dem Fall, dass die Normierung mit hoher Genauigkeit sichergestellt werden kann.
In dem Fall, dass die Genauigkeit des Normierungskoeffizienten in diesem Fall in der Signalcodierungsvorrichtung nicht ausreicht, kann es sein, dass die Genauigkeit des maximalen Spektrumskoeffizienten nicht hinreichend sichergestellt werden kann. Das Verfahren, bei dem die in 19 dargestellte Konfiguration bzw. der dort gezeigte Aufbau verwendet wird, um Toncharakteristikkomponenten in einer mehrstufigen Weise zu extrahieren, wird jedoch angewandt, um zu ermöglichen, das oben erwähnte Problem zu lösen. Wie in 6 und 7 veranschaulicht, besteht entsprechend diesem Verfahren eine starke Möglichkeit dafür, dass die sich auf der Frequenzbasis einander überlappenden Frequenzkomponenten mehrmals als Toncharakteristikkomponenten extrahiert werden. In diesem Falle ist es erwünscht, eine solche nichtlineare Einstellung vorzunehmen, dass eine Einstellung bezüglich des jeweiligen festliegenden Intervalls vorgenommen wird, beispielsweise durch eine logarithmische Skala, damit dann, wenn die Werte der Normierungskoeffizienten kleiner werden, eine höhere Genauigkeit bereitgestellt wird.
Wenn eine derartige Vielzahl von Frequenzkomponenten auf der Seite der Decodierungsvorrichtung synthetisiert wird, dann ist es sogar in dem Fall, dass die Genauigkeit eines Normierungskoeffizienten nicht ausreicht, somit möglich, eine Genauigkeit eines gewissen Grades sicherzustellen. Obwohl das Beispiel, bei dem das akustische Signal durch die Signalcodierungsvorrichtung gemäß der Ausführungsform der Erfindung codiert wird, hauptsächlich beschrieben worden ist, kann das Codieren bei dieser Erfindung überdies auf das Codieren des generellen Wellenformsignals angewandt werden. Es sei darauf hingewiesen, dass die Codierung gemäß dieser Erfindung insbesondere effektiv ist bei der Ausführung einer effizienten Codierung bezüglich eines akustischen Signals, bei dem Toncharakteristikkomponenten eine signifikante Bedeutung unter dem Gesichtspunkt des Gehörsinns besitzen.
Ferner kann die Platte 609 bei der oben beschriebenen Ausführungsform beispielsweise ein magnetooptischer Aufzeichnungsträger, ein optischer Aufzeichnungsträger oder ein optischer Aufzeichnungsträger vom Phasenänderungstyp, etc. sein. Ferner können ein Halbleiterspeicher oder eine IC-Karte, etc. zusätzlich zu einem bandförmigen Aufzeichnungsträger als Aufzeichnungsträger verwendet werden, der die Platte 609 ersetzt.
Obwohl der Fall, dass lediglich Toncharakteristikkomponenten veranlasst sind, sich einer variablen Längencodierung zu unterziehen, bei der oben beschriebenen Ausführungsform beschrieben worden ist, können überdies Rauschcharakteristikkomponenten ebenfalls veranlasst werden bzw. sein, sich einer variablen Längencodierung zu unterziehen.
Industrielle Anwendbarkeit
Wie aus der vorstehenden Beschreibung klar ist, werden in der Signalcodiervorrichtung gemäß dieser Erfindung beim Transformieren eines Eingangssignals in Frequenzkomponenten zur Aufteilung des transformierten Ausgangssignals in ein erstes Signal, bestehend aus Toncharakteristikkomponenten, und ein zweites Signal, bestehend aus anderen Komponenten, zur Codierung dieser ersten und zweiten Signale entsprechende Signalkomponenten des ersten Signals so codiert, dass sie unterschiedliche Codelängen aufweisen, wodurch ermöglicht ist, die Toncharakteristikkomponenten des in Toncharakteristikkomponenten und in Rauschcharakteristikkomponenten zerlegten Signals extrem effizient zu codieren. Damit kann der Codierungswirkungsgrad bezüglich der Gesamtheit der Signalwellenform verbessert werden. Falls derart komprimierte Signale auf oder in einem Aufzeichnungsträger aufgezeichnet werden, kann demgemäß die Aufzeichnungskapazität effektiv genutzt werden, Wenn durch Wiedergabe eines derartigen Aufzeichnungsträgers erhaltene Signale decodiert werden, können darüber hinaus zufriedenstellende Signale, beispielsweise akustische Signale, erhalten werden,

Claims

Signalcodierungsvorrichtung, die für die Codierung eines Eingangssignals geeignet ist, umfassend: eine Transformationseinrichtung (601) zum Transformieren eines Eingangssignals in einen Block aus Frequenzkomponenten durch Spektraltransformationsverarbeitung, wobei jede Frequenzkomponente durch eine Energieverteilung gekennzeichnet ist; eine Trenneinrichtung (801, 802, 805–808) zum Trennen bzw. Aufteilen sämtlicher Frequenzkomponenten des Spektrums des Ausgangssignals der Transformationseinrichtung (601) in ein erstes Signal, bestehend aus Toncharakteristikkomponenten, und ein zweites Signal, bestehend aus anderen Komponenten, wobei jede Tonkomponentencharakteristik eine scharfe Energieverteilung in Bezug auf die Energieverteilung der Frequenzkomponenten in dem Block aufweist; eine erste Codierungseinrichtung (603) zur Normierung der Amplitudeninformation der jeweiligen Toncharakteristikkomponenten des ersten Signals durch Heranziehung von Normierungskoeffizienten und zur Quantisierung der normierten Amplitudeninformation für die Erzeugung eines codierten Signals; und eine zweite Codierungseinrichtung (604) zum Codieren des zweiten Signals, wobei die betreffende erste Codierungseinrichtung (603) derart betrieben ist, dass als codiertes Signal ein codiertes Signal in Bezug auf die Frequenzkomponenten mit Ausnahme einer maximalen Frequenzkomponente der jeweiligen Toncharakteristikkomponenten abgegeben wird.
Signalcodierungsvorrichtung nach Anspruch 1, wobei die Trenneinrichtung mehrmals Frequenzkomponenten extrahiert, die sich in der Frequenzbasis einander überlappen, um den extrahierten Frequenzkomponenten zu ermöglichen, das erste Signal zu sein.
Signalcodierungsvorrichtung nach Anspruch 1 oder 2, wobei Werte der Normierungskoeffizienten so festgelegt sind, dass demgemäß dann, wenn jene Werte kleiner werden, die Genauigkeit größer wird.
Signalcodierungsvorrichtung nach einem der Ansprüche 1 bis 3, wobei das Eingangssignal ein akustisches Signal ist.
Signaldecodierungsvorrichtung, die für die Decodierung eines codierten Signals geeignet ist, welches nach dem Verfahren gemäß einem der Ansprüche 9 bis 11 oder mittels einer Vorrichtung nach einem der Ansprüche 1 bis 4 codiert ist, umfassend: eine erste Decodierunqseinrichtung (702, 715) zum Decodieren eines normierten und codierten ersten Signals, bestehend aus Toncharakteristikkomponenten des Spektrums mit Ausnahme einer maximalen Frequenzkomponente der betreffenden Toncharakteristikkomponenten; eine zweite Decodierungseinrichtung (703) zum Decodieren eines zweiten Signals, bestehend aus anderen Komponenten des Spektrums; und eine Synthetisier-Inverstransformationseinrichtung (711) zum Synthetisieren der jeweiligen Signale für deren inverse Transformation oder zur inversen Transformation der jeweiligen Signale für deren Synthetisierung, wobei die erste Decodierungseinrichtung (702, 715) derart betrieben ist, dass eine maximale Frequenzkomponente der Toncharakteristikkomponente auf der Grundlage eines übertragenen Normierungskoeffizientens wiedergegeben wird.
Signaldecodierungsvorrichtung nach Anspruch 5, wobei die Toncharakteristikkomponenten des ersten Signals in dem Zustand codiert sind, in welchem sie sich in der Frequenzbasis einander überlappen.
Signaldecodierungsvorrichtung nach Anspruch 5 oder 6, wobei die Normierungskoeffizienten so festgelegt sind, dass demgemäß dann, wenn jene Werte kleiner werden, die Genauigkeit größer wird.
Signaldecodierungsvorrichtung nach einem der Ansprüche 5 bis 7, wobei die Synthetisier-Inverstransformationseinrichtung ein akustisches Signal abgibt.
Signalcodierungsverfahren zum Codieren eines Eingangssignals, umfassend die Schritte: Transformieren (601) eines Eingangssignals in einen Block von Frequenzkomponenten durch Spektraltransformationsverarbeitung, wobei jede Frequenz durch eine Energieverteilung gekennzeichnet ist; Trennen bzw. Aufteilen (801, 802, 805–808) sämtlicher Frequenzkomponenten des Spektrums des transformierten Eingangssignals in ein erstes Signal, bestehend aus Toncharakteristikkomponenten, und ein zweites Signal, bestehend aus anderen Komponenten, wobei jede Tonkomponentencharakteristik eine scharfe Energieverteilung in Bezug auf die Energieverteilungen der Frequenzkomponenten in dem Block aufweist; Codieren (603) des ersten Signals durch Normieren der Amplitudeninformation der betreffenden Toncharakteristikkomponenten des ersten Signals durch Heranziehung von Normierungskoeffizienten und Quantisieren der normierten Amplitudeninformation zu deren Codierung; und Codieren (604) des zweiten Signals; wobei der Schritt des Codierens (603) des ersten Signals einen Schritt der Abgabe eines codierten Signals in Bezug auf Frequenzkomponenten mit Ausnahme einer maximalen Frequenzkomponente der betreffenden Toncharakteristikkomponenten als codiertes Signal enthält.
Signalcodierungsverfahren nach Anspruch 9, wobei der Schritt der Trennung bzw. Aufteilung einen Schritt des mehrmaligen Extrahierens der sich einander überlappenden Frequenzkomponenten in der Frequenzbasis enthält.
Signalcodierungsverfahren nach Anspruch 9 oder 10, wobei die Normierungskoeffizienten so festgelegt werden, dass demgemäß dann, wenn jene Werte kleiner werden, die Genauigkeit größer wird.
Signaldecodierungsverfahren zum Decodieren eines codierten Signals, welches nach dem Verfahren gemäß einem der Ansprüche 9 bis 11 oder mittels einer Vorrichtung nach einem der Ansprüche 1 bis 4 codiert ist, umfassend die Schritte: Decodieren (702, 715) eines normierten und codierten ersten Signals, bestehend aus Toncharakteristikkomponenten des Spektrums mit Ausnahme einer maximalen Frequenzkomponente der betreffenden Toncharakteristikkomponenten, wobei jede Tonkomponentencharakterstik eine scharfe Energieverteilung aufweist in Bezug auf die Energieverteilung der Frequenzkomponenten in dem Block, Decodieren (703) eines zweiten Signals, bestehend aus anderen Komponenten des Spektrums; Synthetisieren (711) der jeweiligen Signale zu deren inverser Transformation oder inverse Transformation von entsprechenden Signalen zu deren Synthetisierung, um somit ein Originalsignal wiederzugeben, wobei der Schritt (702, 715) des Decodierens des ersten Signals einen Schritt der Wiedergabe der maximalen Frequenzkomponente der Toncharakteristikkomponenten auf der Grundlage von übertragenen Normierungskoeffizienten umfasst.
Signaldecodierungsverfahren nach Anspruch 12, wobei das erste Signal eine Vielzahl von Toncharakteristikkomponenten enthält, die sich in der Frequenzbasis einander überlappen.
Signaldecodierungsverfahren nach Anspruch 12 oder 13, wobei die Normierungskoeffizienten so festgelegt werden, dass demgemäß dann, wenn jene Werte kleiner werden, die Genauigkeit größer wird.
Aufzeichnungsträger (609), auf dem codierte Signale aufgezeichnet sind, die nach dem Codierungsverfahren gemäß einem der Ansprüche 9 bis 11 oder durch eine Codierungsvorrichtung nach einem der Ansprüche 1 bis 4 codiert sind, welche das Codierungsverfahren nach einem der Ansprüche 9 bis 11 ausgeführt.