DE69829242T2 - Tonsignalkodierverfahren und -gerät - Google Patents

Tonsignalkodierverfahren und -gerät Download PDF

Info

Publication number
DE69829242T2
DE69829242T2 DE69829242T DE69829242T DE69829242T2 DE 69829242 T2 DE69829242 T2 DE 69829242T2 DE 69829242 T DE69829242 T DE 69829242T DE 69829242 T DE69829242 T DE 69829242T DE 69829242 T2 DE69829242 T2 DE 69829242T2
Authority
DE
Germany
Prior art keywords
signals
coding
channel
processing
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69829242T
Other languages
English (en)
Other versions
DE69829242D1 (de
Inventor
Osamu Shinagawa-ku Shimoyoshi
Kyoya Shinagawa-ku Tsutsui
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Application granted granted Critical
Publication of DE69829242D1 publication Critical patent/DE69829242D1/de
Publication of DE69829242T2 publication Critical patent/DE69829242T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00043Adaptive transform acoustic coding [ATRAC]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10592Audio or video recording specifically adapted for recording or reproducing multichannel signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

  • Hintergrund der Erfindung
  • Gebiet der Erfindung
  • Die Erfindung bezieht sich auf ein Codierungsverfahren und eine Codierungsvorrichtung, die für eine Codierung von Eingangssignalen mittels einer hocheffizienten Codierung sowie zur Wiedergabe von Wiedergabesignalen auf eine Übertragung, Aufzeichnung, Wiedergabe und Decodierung hin geeignet sind.
  • Beschreibung der verwandten Technik
  • Es ist ein Informationsaufzeichnungsträger vorgeschlagen worden, der Signale, wie die codierte akustische Information oder die Musikinformation (nachstehend als Audiosignale bezeichnet) aufzuzeichnen imstande ist, wie eine magnetooptische Disk. Unter den Verfahren zur hocheffizenten Codierung der Audiosignale gibt es eine sogenannte Transformationscodierung, die ein Blockbildungs-Frequenzspektrum-Aufteilungsverfahren zur Transformation eines Zeitbereichsignals in Frequenzbereichsignale durch eine orthogonale Transformation und Codierung der Spektralkomponenten von einem Frequenzband in ein anderes darstellt, und ein Sub- bzw. Unterband-Codierungs-(SBC)-Verfahren, welches ein Nicht-Blockbildungs-Frequenzspektrum-Aufteilungsverfahren zur Aufteilung der Zeitbereichs-Audiosignale in eine Vielzahl von Frequenzbändern ohne eine Blockbildung und Codierung der resultierenden Signale der Frequenzbänder darstellt. Es ist außerdem ein hocheffizientes Codierungsverfahren bzw. eine hocheffiziente Codierungstechnik bekannt, das bzw. die eine Kombination der Subbandcodierung und der Transformationscodierung darstellt; in diesem Falle werden die Zeitbereichssignale in eine Vielzahl von Frequenzbändern mit Hilfe des SBC-Verfahrens aufgeteilt, und die resultierenden Bandsignale werden orthogonal in Spektralkomponenten transformiert, die von Band zu Band codiert werden.
  • Unter den oben erwähnten Filtern gibt es ein sogenanntes QMF-Filter (Quadratur-Spiegel-Filter), wie es in R.E. Crochiere, Digital Coding of Speech in subbands, Bell Syst. Tech. J., Vol. 55, Nr. 8, 1976 erörtert ist. Dieses QMF-Filter teilt das Frequenzspektrum in zwei Bänder von gleichen Bandbreiten auf und ist dadurch gekennzeichnet, dass eine sogenannte Faltung auf eine anschließende Zusammensetzung der geteilten Bänder nicht hervorgerufen wird. Die Technik des Aufteilens des Frequenzspektrums ist in Joseph H. Rothweiler, Polyphase Quadrature Filters – in A New Subband Coding Technique, ICASSP 83, Boston erörtert. Dieses Polyphasen-Quadraturfilter ist dadurch gekennzeichnet, dass das Signal zu einem Zeitpunkt in eine Vielzahl von Bändern von gleicher Bandbreite aufgeteilt werden kann.
  • Unter den oben erwähnten Verfahren zur orthogonalen Transformation gibt es ein solches Verfahren bzw. eine solche Technik, bei dem bzw. der bezüglich eines Eingangs-Audiosignals zur jeweils zuvor festgelegten Einheit-Zeit, wie jeden Rahmen, eine Blockbildung erfolgt und eine diskrete Fouriertransformation (DFT), eine diskrete Cosinustransformation (DCT) oder eine modifizierte diskrete Cosinustransformation (MDCT) auf den jeweiligen Block angewandt wird, um die Signale von der Zeitachse in die Frequenzachse umzusetzen. Erörterungen über die MDCT-Transformation finden sich in J.P. Princen und A.B. Bradley, Subband/Transform coding Using Filter Bank based on Time Domain Aliasing Cancellation, ICASSP 1987.
  • Falls die oben erwähnte DFT- oder DCT-Transformation als Verfahren zum Transformieren von Wellenformsignalen in Spektralsignale angewandt wird und wenn die Transformation auf der Grundlage eines Zeitblockes angewandt wird, der aus M Abtast proben besteht, dann werden M unabhängige Echtzeitdaten erhalten. Es sei darauf hingewiesen, dass zur Verringerung von Übergangsverzerrungen zwischen Zeitblöcken ein gegebener Zeitblock üblicherweise mit M1 Abtastproben von beiden Nachbarblöcken überlappt wird und dass M Echtzahl-Daten im Mittel quantisiert und im DFT- oder DCT-Verfahren für (M-M1) Abtastproben quantisiert und codiert werden. Es sind diese M Echtzahl-Daten, die anschließend quantisiert und codiert werden.
  • Falls andererseits das oben erwähnte MDCT-Verfahren als Verfahren zur orthogonalen Transformation angewandt wird, werden M unabhängige Echtzahl-Daten aus 2M Abtastproben erhalten, die mit M Abtastproben von beiden benachbarten Zeitblöcken überlappt sind. Somit werden beim MDCT-Verfahren M Echtzahl-Daten im Mittel für M Abtastproben erhalten und anschließend quantisiert und codiert. Eine Decodierungsvorrichtung fügt Wellenformelemente hinzu, die auf eine inverse Transformation in jedem Block von den Codes erhalten werden, welche durch das MDCT-Verfahren mit einer Interferenz zur Neubildung der Wellenformsignale erhalten werden.
  • Falls ein Zeitblock für eine Transformation verlängert wird, wird im allgemeinen die Spektrums-Frequenzauflösung derart verbessert, dass die Signalenergie in spezifizierten Frequenzkomponenten konzentriert ist. Durch Anwendung des MDCT-Verfahrens, bei dem durch Überlappen mit einer Hälfte der jeweiligen beiden benachbarten Blöcke eine Transformation mit langen Blocklängen ausgeführt wird und bei dem die Anzahl der resultierenden Spektralsignale nicht über die Anzahl der ursprünglichen Zeit-Abtastproben erhöht ist, kann daher eine Codierung mit einem höheren Wirkungsgrad vorgenommen werden als in dem Fall, dass das DFT- oder DCT-Verfahren angewandt wird. Da die benachbarten Blöcke eine ausreichend lange Überlappung miteinander besitzen, kann überdies die Zwischen- bzw. Interblockverzerrung der Wellenformsignale verringert werden. Falls die Transformationsblocklänge zur Transformation verlängert wird, ist jedoch mehr Arbeitsbereich für die Transformation erfor derlich, was somit eine Verringerung der Größe einer Wiedergabeeinrichtung behindert. Insbesondere die Anwendung eines langen Transformationsblocks zu einem Zeitpunkt, zu dem es schwierig ist, den Integrationsgrad eines Halbleiters zu erhöhen, sollte vermieden werden, da dies die Herstellungskosten erhöht.
  • Durch Quantisieren von Signalen, die durch ein Filter oder durch orthogonale Transformation in einer Vielzahl von Frequenzbändern aufgeteilt sind, kann das Frequenzband, in welchem das Quantisierungsrauschen auftritt, derart gesteuert werden, dass durch Anwendung von Akustikcharakteristiken, wie Maskierungseffekten, eine Codierung mit psychoakustisch höherem Wirkungsgrad erzielt werden kann. Falls die Signalkomponenten mit den Maximalwerten der Absolutwerte der Signalkomponenten in den jeweiligen Bändern normiert werden, kann eine Codierung mit noch höherem Wirkungsgrad erreicht werden.
  • Hinsichtlich der Frequenzbandbreiten im Falle der Quantisierung der Frequenzkomponenten, die auf eine Aufteilung des Frequenzspektrums hin erhalten werden, ist es bekannt, das Frequenzspektrum derart zu unterteilen, dass die psychoakustischen Charakteristiken des menschlichen Hörsystems berücksichtigt werden. Genauer gesagt werden die Audiosignale in eine Vielzahl von Bändern, wie in 25 Bänder unter Heranziehung von Bandbreiten aufgeteilt, die mit zunehmender Frequenz größer werden. Diese Bänder sind als kritische Bänder bekannt. Bei der Codierung der Band-basierten Daten wird eine Codierung durch eine feste oder adaptive Bitzuweisung auf der Bandbasis ausgeführt. Bei der Codierung von Koeffizientendaten, die durch die MDCT-Verarbeitung mittels Bitzuweisung erhalten werden, wie oben beschrieben, erfolgt eine Codierung durch eine adaptive Zahl von Bitzuweisungen für Band-basierte MDCT-Koeffizienten, die durch eine Block-basierte MDCT-Verarbeitung erhalten werden. Als diese Bitzuweisungsverfahren bzw. -techniken sind die folgenden beiden Verfahren bzw. Techniken bekannt.
  • So wird beispielsweise in R. Zelinsky und P. Noll, Adaptive Transfer Coding of Speech Signals und in 'IEEE Transactions of Acoustics, Speech and Signal Processing, Vol. ASSP-25, Nr. 4, August 1977, eine Bitzuweisung auf der Grundlage der Größe der Band-basierten Signale vorgenommen. In diesem System wird das Quantisierungsrauschspektrum flach, so dass das Quantisierungsrauschen minimiert ist. Der tatsächliche Rauscheindruck befindet sich jedoch nicht psychoakustisch beim Optimum, da der psychoakustische Maskierungseffekt nicht ausgenutzt ist.
  • In einer Veröffentlichung 'ICASSP 1980, The critical band coder – digital encoding of the perceptual requirements of the auditory system, M.A. Krasner, MIT', wird der psychoakustische Maskierungseffekt dazu herangezogen, eine feste Bitzuweisung festzulegen, die das erforderliche Signal-Rausch-Verhältnis bzw. den notwendigen Störabstand für jedes kritische Band liefert. Falls dieses Verfahren bzw. diese Technik angewandt wird, um Chakteristiken einer eingangsseitigen Sinuswelle zu messen, werden jedoch keine optimalen Ergebnisse erzielt, und zwar wegen der festliegenden Zuweisung von Bits zu den kritischen Bändern.
  • Zur Überwindung dieser Probleme ist eine hocheffiziente Codierungsvorrichtung vorgeschlagen worden, bei der ein Tel der Gesamtanzahl von Bits, die für eine Bitzuweisung nutzbar sind, für ein festes Bitzuweisungsmuster herangezogen wird, welches von einem kleinen Block zu einem anderen vorab festliegt, und der übrige Teil wird für eine Bitzuweisung genutzt, die von den Signalamplituden der jeweiligen Blöcke abhängt, wobei das Bitzahl-Teilungsverhältnis zwischen der festliegenden Bitzuweisung und der von den Signalamplituden abhängigen Bitzuweisung abhängig gemacht ist von einem Signal, welches sich auf ein Eingangssignal bezieht, so dass das Bitzahl-Teilungsverhältnis für die festliegende Bitzuweisung größer wird, je gleichmäßiger das Signalspektrum wird.
  • Dieses Verfahren bzw. diese Technik verbessert das Signal-Rausch-Verhältnis insgesamt signifikant dadurch, dass mehr Bits einem Block zugeteilt werden, der ein bestimmtes Signalspektrum enthält, welcher eine konzentrierte Signalenergie zeigt. Durch Anwendung der obigen Verfahren zur Verbesserung der Signal-Rausch-Verhältnischarakteristiken werden nicht nur die gemessenen Werte erhöht, sondern es wird bzw. ist außerdem der vom Hörer wahrgenommene Ton in der Signalqualität verbessert, da das menschliche Hörsystem für Signale empfindlich ist, die intensive Spektralkomponenten verfügt.
  • Eine Vielfalt von unterschiedlichen Bitzuweisungsverfahren ist vorgeschlagen worden, und eine Modellsimulierung des menschlichen Hörmechanismus ist ebenfalls ausgefeilter geworden, so dass ein wahrnehmbar höherer Codierungswirkungsgrad unter der Annahme erzielt werden kann, dass die Codierungsvorrichtungsfähigkeit entsprechend verbessert wird.
  • Bei diesen Verfahren ist es übliche Praxis, Echtzahl-Referenzwerte für eine Bitzuweisung zu ermitteln, die Signal-Rausch-Charakteristiken zu realisieren, wie sie durch Berechnungen so genau wie möglich ermittelt werden, und ganzzahlige Werte, die sich an die Referenzwerte annähern, als zugewiesene Bitzahlen zu verwenden.
  • Zur Bildung einer realen Codefolge genügt es, wenn die Quantisierungs-Feinheitsinformation und die Normierungskoeffizienteninformation mit zuvor festgelegten Zahlen von Bits codiert werden, und zwar von einem Normierungs-/Quantisierungsband zu einem anderen, und wenn die normierten und quantisierten Spektralsignalkomponenten codiert werden. In der ISO-Norm (ISO/IEC 11172-3:1993 (E), 1993) ist ein hocheffizientes Codierungssystem beschrieben, bei dem die Zahlen der Bits, welche die Quantisierungs-Feinheitsinformation darstellen, so festgelegt sind, dass sie von einem Band zum anderen verschieden sind. Genauer gesagt wird die Anzahl der die Quantisie rungs-Feinheitsinformation darstellenden Bits so festgelegt, dass sie mit zunehmender Frequenz abnimmt.
  • Es ist außerdem ein Verfahren zur Bestimmung der Quantisierungs-Feinheitsinformation in der Decodierungsvorrichtung beispielsweise aus der Normierungs-Koeffizienteninformation bekannt. Da die Beziehung zwischen der Normierungs-Koeffizienteninformation und der Quantisierungs-Feinheitsinformation zum Zeitpunkt der Festlegung der Norm bzw. des Standards festgelegt ist, wird es unmöglich, in Zukunft die Quantisierungs-Feinheitssteuerung auf der Grundlage eines fortschrittlicheren psychoakustischen Modells einzuführen. Falls eine Breite im Kompressionsverhältnis zu realisieren ist, wird es zusätzlich erforderlich, die Beziehung zwischen der Normierungs-Koeffizienteninformation und der Quantisierungs-Feinheitsinformation von einem Kompressionsverhältnis zu einem anderen festzulegen.
  • Die oben beschriebenen Codierungsverfahren können auf die jeweiligen Kanäle von Akustiksignalen angewandt werden, wobei diese Kanäle durch eine Vielzahl von Kanälen gebildet sind. Die Codierungsverfahren können jeweils beispielsweise auf den linken Kanal, der einem Lautsprecher der linken Seite zugehörig ist, und dem rechten Kanal, welcher einem Lautsprecher auf der rechten Seite zugehörig ist, angewandt werden. Die Codierungsverfahren können außerdem auf das (L+R)/2-Signal angewandt werden, welches auf eine Zusammensummierung der Signale des L-Signals und des R-Signal erhalten werden. Die oben erwähnten Verfahren können außerdem auf Signale (L+R)/2 und (L-R)/2 zur Realisierung einer effizienten Codierung angewandt werden. Unterdessen genügt die Datenmenge für eine Codierung von Einkanalsignalen, die gleich der Hälfte der Datenmenge ist, welche für eine unabhängige Codierung der Zweikanalsignale erforderlich ist. Somit wird ein solches Verfahren zur Aufzeichnung von Signalen auf einem Aufzeichnungsträger häufig angewandt, bei dem ein Betrieb zur Aufzeichnung als einkanalige Mono-Signale und ein Betrieb zur Aufzeichnung von zweikanaligen Stereosignalen bereitstehen und bei dem eine Aufzeich nung von Mono-Signalen vorgenommen werden kann, falls es erforderlich ist, eine Langzeitaufzeichnung vorzunehmen.
  • Es ist außerdem ein Verfahren zur Anwendung von Codes variabler Länge für eine Codierung zur Realisierung einer effizienteren Codierung von quantisierten Spektralsignalkomponenten bekannt, wie dies in D.A. Huffman, "A Method for Construction of Minimum Redundancy Codes" in Proc. I.R.E., 40, Seite 1098 (1952) beschrieben ist.
  • In der internationalen Veröffentlichung WO94/28633 der Anmelderin ist ein Verfahren zur wahrnehmbaren Abtrennung von kritischen Tonkomponenten aus den Spektralsignalen angegeben, das heißt von Signalkomponenten, bei denen die Signalenergie in der Nähe einer bestimmten Frequenz konzentriert ist, wobei die Signalkomponenten von den übrigen Spektralkomponenten getrennt codiert werden. Dies ermöglicht es, Audiosignale mit einem hohen Kompressionsverhältnis ohne nennenswerte Verschlechterung der pyschoakustischen Tonqualität effizient zu codieren.
  • Unterdessen werden derzeit die Verfahren zur Verbesserung des Codierungswirkungsgrades entwickelt und nacheinander eingeführt, so dass es dann, wenn eine Norm angewandt wird, die eine neu entwickelte geeignete Codierung enthält, möglich wird, eine längere Aufzeichnung vorzunehmen oder eine Aufzeichnung von Audiosignalen von höherer Tonqualität während derselben Aufzeichnungszeit vorzunehmen.
  • Bei der Festlegung der oben beschriebenen Norm bzw. des oben beschriebenen Standards ist eine Erlaubnis zur Aufzeichnung der Kennbit- bzw. Flag-Information betreffenden den Standard bezüglich des Informationsaufzeichnungsträgers als zu berücksichtigen belassen worden, so dass der Standard in Zukunft modifiziert oder erweitert werden kann. So wird beispielsweise eine "0" oder "1" als 1-Bit-Flag-Information dann aufgezeichnet, wenn der Standard zunächst festgelegt oder modifiziert wird. Die Wiedergabevorrichtung, die dem so modifizierten Standard entspricht, stellt fest, ob die Flag-Information "0" oder "1" ist; falls diese Flag-Information gegeben ist mit "1", wird das Signal von dem Informationsaufzeichnungsträger entsprechend dem modifizierten Standard gelesen und wiedergegeben. Falls die Flag-Information gegeben ist mit "0" und falls die Wiedergabevorrichtung ebenfalls den zunächst festgelegten Standard erfüllt, wird das Signal auf der Grundlage des Standards von dem Informationsaufzeichnungsträger gelesen und wiedergegeben. Falls die Wiedergabevorrichtung den zunächst festgelegten Standard nicht erfüllt, wird das Signal nicht wiedergegeben.
  • Die Anmelderin dieser Anmeldung hat in der japanischen Patentanmeldung Nr. H-9-42514 ein Codierungsverfahren zum Codieren von Mehrkanalsignalen im Hinblick auf einen Rahmen vorgeschlagen, dessen Größe durch einen Codierer nicht gesteuert werden kann. Bei diesem Verfahren werden Signale eines Kanals, die entsprechend einem einmal festgelegten Standard (nachstehend als "alter Standard" bezeichnet) zu codieren sind, mit einer kleineren Anzahl von Bits codiert als mit der maximalen Anzahl von Bits, welche einem bestimmten Rahmen zugeteilt werden kann; die codierten Signale von anderen Kanälen werden bzw. sind in einem leeren Bereich innerhalb des so gebildeten Rahmens angeordnet, um eine Wiedergabe von Signalen von einer geringen Anzahl von Kanälen mit einer Wiedergabevorrichtung zu ermöglichen, die dem alten Standard zugehörig ist (nachstehend als dem alten Standard genügende Wiedergabevorrichtung bezeichnet), während Signale von einer größeren Anzahl von Kanälen durch Verwendung einer Wiedergabevorrichtung wiedergegeben werden können (nachstehend als einem neuen Standard genügende Wiedergabevorrichtung bezeichnet), die dem neuen Standard (nachstehend als neuer Standard bezeichnet) zugehörig ist.
  • Durch dieses Verfahren ist dem Codierungsverfahren für Signale von Kanälen, die durch die dem alten Standart genügende Wiedergabevorrichtung nicht wiedergegeben werden, ein höherer Codierungswirkungsgrad als beim Codierungsverfahren gemäß dem alten Standard gegeben worden, um eine Verschlechterung in der Tonqualität zu vermindern, die sonst durch eine Codierung von Mehrkanalsignalen hervorgerufen wird. Durch Aufzeichnen eines Signals A = (L+R)/2 in einem Bereich, der von der dem alten Standard genügenden Wiedergabevorrichtung wiedergebbar ist, und von Signalen B = (L-R)/2 in einem Bereich, der nicht von der Wiedergabevorrichtung wiedergebbar ist, die dem alten Standard genügt, gemäß diesem Verfahren kann die dem alten Standard genügende Wiedergabevorrichtung monaurale Signale wiedergeben, während die dem neuen Standard genügende Wiedergabevorrichtung Stereosignale L und R von den Kanälen A und B wiedergeben kann.
  • Das Verfahren zur Codierung der Signale (L+R)/2 und (L-R)/2 sowie zur Wiedergabe der codierten Stereosignale ist beispielsweise beschrieben in James D. Johnston, "Perceptual Transform Coding of Wideband Stereo Signals", ICASSP89, Seiten 1993–1995).
  • Die Anmelderin der vorliegenden Anmeldung hat ferner in der japanischen Patentanmeldung Nr. H-92448 ein Verfahren vorgeschlagen, bei dem Signale eines Bereichs, die nicht von der dem alten Standard genügenden Wiedergabevorrichtung wiedergegeben werden, von (L-R)/2, L und R zur Verringerung der Auswirkung des Quantisierungsfehlers ausgewählt werden, der selbst vorhanden ist, wenn die Signale mit einem signifikanten Pegelunterschied zwischen linken und rechten Kanälen codiert werden bzw. sind.
  • Falls es unterdessen erwünscht ist, eine Erweiterung des Standards unter Anwendung eines Signaldecodierungsverfahrens zu versuchen, welches eine größere Anzahl von Kanalsignalen durch die Erweiterung des Standards wiederzugeben erlaubt, während sie eine geringere Anzahl von Kanälen durch die dem alten Standard genügende Wiedergabevorrichtung zur Erweiterung des Standards für die Wiedergabe von Stereosignalen wiederzugeben erlaubt, gibt es Fälle, in denen das auf die Codierung hin hervorgerufene Quantisierungsrauschen Probleme in Abhängigkeit von den Arten der Stereosignale hervorruft.
  • Unter Bezugnahme auf 1 und 2 wird die Art und Weise der Erzeugung des Quantisierungsrauschens erläutert.
  • 1A und 1B zeigen Frequenzspektralkomponenten von Komponenten typischer Stereosignale eines linken Kanals (L) und eines rechten Kanals (R).
  • 1C und 1D veranschaulichen Frequenzspektrum-Signalverläufe von Signalen, die auf eine Umwandlung der L und R-Signale in Signale erhalten werden, welche durch eine Kanalumwandlung (L+R)/2 und L-R)/2 entsprechen. Da im allgemeinen die jeweiligen Kanäle von Stereosignalen eine starke Korrelation zeigen, ist der Kanal von B = (L-R)/2 im Signalkomponentenpegel signifikant kleiner als der L- oder R-Kanal.
  • 1E und 1F veranschaulichen den Zustand des Quantisierungsrauschens, welches auf eine Codierung und anschließende Decodierung von Signalen der A- und B-Kanäle durch das hocheffiziente Codierungsverfahren erzeugt wird. Mit N1 und N2 sind die Frequenzkomponenten des auf die Codierung der A- und B-Kanäle hin erzeugten Quantisierungsrauschens bezeichnet. Das auf eine Codierung und Decodierung des Kanals A hin erhaltene Signal und jenes Signal, welches auf eine Codierung und Decodierung des Kanals B hin erhalten wird, sind mit (A+N1) bzw. (B+N2) bezeichnet. Bei dem hocheffizienten Codierungsverfahren kommt es häufig vor, dass der Quantisierungsrauschpegel vom Pegel der ursprünglichen Signalkomponente abhängt. In einem solchen Fall ist der Pegel des Quantisierungsrauschens N2 signifikant niedriger als das Quantisierungsrauschen N1.
  • 1G und 1H veranschaulichen die Art und Weise, in der die jeweiligen Kanäle der Stereosignale aus den Signalkomponenten (A+N1) und (B+N2) abgetrennt worden sind. Durch Hinzufügen von (A+N1) zu (B+N2) wird die R-Komponente ausgelöscht, während lediglich die L-Komponente wiedererlangt werden kann. In entsprechender Weise wird durch Subtrahieren von (B+N2) von (A+N1) die L-Komponente ausgelöscht, während lediglich die R-Komponente wiedererlangt werden kann.
  • Die Quantisierungsrauschen N1 und N2 bleiben als (N1+N2) oder als (N1-N2) zurück. Da N2 im Pegel signifikant niedrig ist im Vergleich zu N1, ruft weder (N1+N2) noch (N1-N2) psychoakustische Probleme hervor.
  • 2 zeigt den Zustand des Quantisierungsrauschens, welches auf eine Codierung, Decodierung und Wiedergabe von Stereosignalen hin erzeugt wird, die keine Korrelation zwischen linken und rechten Kanälen aufweisen.
  • 2A und 2B zeigen die Frequenzspektral-Signalverläufe von linken Kanal-(L)-Komponenten bzw. von rechten Kanal-(R)-Komponenten, bei denen keine Korrelation zwischen linken und rechten Kanälen vorhanden ist.
  • 2C und 2D zeigen die Spektral-Signalverläufe von Signalen, die auf eine Kanalumsetzung der L- und R-Signale in Signale erhalten werden, welche den Signalen (L+R)/2 bzw. (L-R)/2 äquivalent sind. Wie beim Beispiel von 1 sind die Kanäle (L+R)/2 und (L-R)/2 als Kanäle A bzw. B bezeichnet. Da L und R keine Korrelation zeigen, ist das Signal B = (L-R)/2 im Signalpegel nicht abgesenkt.
  • 2E und 2F zeigen den Zustand des Quantisierungsrauschens, welches auf eine Codierung der Signale der Kanäle A und B durch das oben beschriebene hocheffiziente Codierungsverfahren und durch Decodierung der codierten Signale erzeugt wird. Mit N1 und N2 sind Zeitachsen-Signalverläufe der bei der Codierung der Signale der Kanäle A bzw. B erzeugten Quantisierungsrauschkomponenten bezeichnet. Wie beim Beispiel gemäß 1 sind die auf eine Codierung und Decodierung der A- und B-Kanäle hin erhaltenen Signale mit (A+N1) bzw. (B+N2) bezeichnet.
  • 2G und 2H zeigen den Zustand, in welchem die jeweiligen Kanäle der Stereosignale aus den Signalverläufen (A+N1) und (B+N2) abgetrennt sind. Zusätzlich zu (A+N1) und (B+N2) löscht sich die L-Komponente aus, wodurch ermöglicht ist, lediglich die R-Komponente wiederzuerlangen.
  • Da die Komponenten von (N1+N2) auf der Seite des hohen Bereichs und die Komponenten von (N1-N2) auf der Seite des niedrigen Bereichs durch die ursprünglichen Signale nicht maskiert bzw. überdeckt werden, rufen diese Quantisierungsrauschen negative psychoakustische Effekte hervor.
  • Da bei Stereosignalen die Signalpegel oder Energien von beiden Kanälen im Wesentlichen unverändert sind, ist es in entsprechender Weise schwierig, einen Kanal für eine solche Codierung auszuwählen, dass das Quantisierungsrauschen in Abhängigkeit vom Signalpegel oder der Signalenergie minimiert wird.
  • Aus EP-A-0 597 649 ist ein Codierungsverfahren zur Codierung einer Vielzahl von Kanalsignalen bekannt, bei dem die Lautstärke des Quantisierungsrauschens zwischen den jeweiligen Kanälen gesteuert wird, wobei eine Quantisierung auf der Grundlage einer Korrelation der Kanalsignale vorgenommen wird.
  • Zusammenfassung der Erfindung
  • Eine Aufgabe der vorliegenden Erfindung besteht darin, ein Informationscodierungsverfahren und eine Informationscodierungsvorrichtung bereitzustellen, die es ermöglichen, die Auswirkung des Quantisierungsrauschens zu verringern, die ansonsten nach einer Decodierung anlässlich einer Codierung und Decodierung auftritt, was eine Mehrzahl von Kanälen durch eine neue Standard-Erweiterung realisiert, während eine Wiedergabe durch eine dem alten Standard genügende Wiedergabevorrichtung ermöglicht ist.
  • Gelöst wird diese Aufgabe durch ein Codierungsverfahren und durch eine Codierungsvorrichtung gemäß den beigefügten unabhängigen Ansprüchen. Vorteilhafte Merkmale der vorliegenden Erfindung sind in den entsprechenden Unteransprüchen erfasst.
  • Somit stellt die vorliegende Erfindung eine Informationsaufzeichnungsvorrichtung zur Verfügung, welche die Auswirkung des Quantisierungsfehlers verringert, der auf eine Decodierung zur Zeit einer Codierung und Decodierung hervorgerufen wird, was eine Mehrzahl von Kanälen durch eine neue Standard-Erweiterung realisiert, während eine Wiedergabe durch eine einem alten Standard genügende Wiedergabevorrichtung ermöglicht ist, und zwar durch Mischen von Eingangssignalen, die durch eine Vielzahl von Kanälen gebildet sind, in dem Mischungsverhältnis, wie es in Abhängigkeit von der Interkanal-Korrelation festgelegt ist.
  • Dies bedeutet, dass bei dem Verfahren zur Ermöglichung einer Mehrkanal-Wiedergabe über eine verlängerte Zeitspanne mittels einer einem neuen Standard genügenden Aufzeichnungsvorrichtung unter Ermöglichung einer Wiedergabe durch eine einem alten Standard genügende Wiedergabevorrichtung die vorliegende Erfindung eine Signalwiedergabe in einer solchen Weise ermöglicht, dass die Auswirkung der Verringerung der Tonqualität durch Nutzung einer Mehrzahl von Kanälen auf ein Minimum herabgesetzt werden kann.
  • Kurze Beschreibung der Zeichnungen
  • 1A bis 1F veranschaulichen den Zustand des auf eine Codierung hin erzeugten Quantisierungsrauschens in Abhängigkeit von den Arten der Stereosignale, wenn die Stereosignale auf eine Standard-Erweiterung hin wiedergegeben werden.
  • 2A bis 2H veranschaulichen den Zustand des Quantisierungsrauschens, welches auf eine Codierung, Decodierung und Wiedergabe von Stereosignalen erzeugt wird, bei denen zwischen linken und rechten Kanälen keine Korrelation vorhanden ist.
  • 3 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Aufzeichnungs-/Wiedergabevorrichtung als einer Ausführungsform einer Aufzeichnungs-/Wiedergabevorrichtung zur Aufzeichnung bzw. Wiedergabe von komprimierten Daten gemäß der vorliegenden Erfindung.
  • 4 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Codierungsvorrichtung gemäß der vorliegenden Erfindung.
  • 5 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Signalkomponenten-Codierungsschaltung gemäß der vorliegenden Erfindung.
  • 6 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Umsetzschaltung gemäß der vorliegenden Erfindung.
  • 7 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Decodierungsschaltung gemäß der vorliegenden Erfindung.
  • 8 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Rückumsetzungsschaltung gemäß der vorliegenden Erfindung.
  • 9 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Signalkomponenten-Decodierungsschaltung gemäß der vorliegenden Erfindung.
  • 10 veranschaulicht ein grundsätzliches Codierungsverfahren.
  • 11 veranschaulicht den Aufbau einer Codefolge eines gemäß dem grundsätzlichen Codierungsverfahren codierten Rahmens.
  • 12 veranschaulicht ein Beispiel der Anordnung von L- und R-Kanälen von Rahmen zu Rahmen.
  • 13 zeigt ein Beispiel einer Anordnung eines (L+R)/2-Kanals für einen Rahmen.
  • 14 veranschaulicht ein Codierungsverfahren zur Codierung der Signalkomponenten, die in Ton- und Nicht-Ton-Komponenten aufgeteilt sind.
  • 15 veranschaulicht einen Aufbau einer Codefolge, die durch das Codierungsverfahren zur Codierung der Ton- und Rauschkomponenten codiert ist, welche aus den Signalkomponenten abgeteilt sind.
  • 16 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Signalkomponenten-Codierungsschaltung zur Codierung der Ton- und Rauschkomponenten, die von den Signalkomponenten abgeteilt sind.
  • 17 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Signalkomponenten-Decodierungsschaltung zur Decodierung der von den Signalkomponenten abgeteilten codierten Ton- und Rauschkomponenten.
  • 18 veranschauliche das Aufzeichnungsformat im Falle der Aufzeichnung der Codefolge des A-Codecs.
  • 19 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Codierungsvorrichtung, welche die Codefolge gemäß 18 erzeugt.
  • 20 veranschaulicht in einem Ablaufdiagramm die Verarbeitung zur Zeit der Erzeugung der Codefolge gemäß 18 durch die Codefolge-Erzeugungsschaltung gemäß 17.
  • 21 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Decodierungsschaltung, die für eine Decodierung der Codefolge gemäß 18 geeignet ist, welche unter Anwendung des Codierungsverfahrens der vorliegenden Erfindung erzeugt wird.
  • 22 veranschaulicht in einem Ablaufdiagramm den Verarbeitungsablauf, wenn die Codefolge gemäß 18 durch die Codefolge-Abtrennschaltung gemäß 21 abgetrennt wird.
  • 23 zeigt in einem Blockschaltungsdiagramm einen veranschaulichenden Aufbau einer Codierungsvorrichtung, die für eine adaptive Kanalumsetzung als eine Ausführungsform der vorliegenden Erfindung geeignet ist.
  • 24 zeigt in einem Blockschaltungsdiagramm den Aufbau einer veranschaulichenden Ausführungsbeispiels der adaptiven Kanalumsetzschaltung gemäß 23.
  • 25 veranschaulicht in einem Ablaufdiagramm den Verarbeitungsablauf zur Zeit der Festlegung des Kanal-Mischungsverhältnisses R_m in einer Kanal-Mischverhältnis-Festlegungsschaltung gemäß 24.
  • 26 zeigt in einem Blockschaltungsdiagramm ein veranschaulichendes Beispiel der Kanal-Mischschaltung gemäß 24.
  • 27 zeigt in einem Blockschaltungsdiagramm den Aufbau eines veranschaulichenden Beispiels einer adaptiven Kanalumsetzschaltung, die eine Kanalmischungs-Umsetzschaltung aufweist, welche aus der Kanalmischschaltung und der Kanalumsetzschaltung kombiniert ist.
  • 28 zeigt in einem Blockschaltungsdiagramm den Aufbau eines veranschaulichenden Beispiels der in 27 dargestellten adaptiven Kanalmischungs-Umsetzschaltung.
  • 29A und 29B veranschaulichen Änderungen in den L- und R-Kanälen in der Kanalmischschaltung gemäß 24 und der Ausgangssignale der L'- und R'-Signale.
  • 30A bis 30H veranschaulichen den Zustand des Quantisierungsrauschens, welches nach Decodierung der in 29B dargestellten L'- und R'-Kanäle erzeugt wird.
  • Beschreibung der bevorzugten Ausführungsformen
  • Unter Bezugnahme auf die Zeichnungen werden nunmehr bevorzugte Ausführungsformen der vorliegenden Erfindung im Einzelnen erläutert.
  • 3 zeigt einen schematischen Aufbau einer die vorliegende Erfindung verkörpernden Datenaufzeichnungs- und/oder Datenwiedergabevorrichtung zur Aufzeichnung bzw. Wiedergabe von komprimierten Daten.
  • In der in 3 dargestellten Datenaufzeichnungs- und/oder Datenwiedergabevorrichtung für die Aufzeichnung bzw. Wiedergabe von komprimierten Daten wird eine magnetooptische Platte bzw. Disk 1, die mittels eines Spindelmotors (M) 51 in Drehungen versetzt wird, als Aufzeichnungsträger verwendet. Zur Aufzeichnung von Daten auf der magnetooptischen Disk 1 wird ein Aufzeichnungsdaten entsprechendes moduliertes Magnetfeld an einen Magnetkopf 54 angelegt, während ein Laserlichtstrahl von einem optischen Kopf (H) 53 im Zuge der Ausführung einer sogenannten Magnetfeld-Modulationsaufzeichnung zur Aufzeichnung von Daten längs der Aufzeichnungsspur der magnetooptischen Disk 1 abgestrahlt wird. Zur Wiedergabe wird der Aufzeichnungsspur der magnetooptischen Disk 1 mit dem Laserlichtstrahl von dem optischen Kopf 53 zur fotomagnetischen Wiedergabe nachgelaufen.
  • Der optische Kopf 53 besteht aus einer Laserlichtquelle, wie einer Laserdiode, optischen Komponenten, wie einer Kollimatorlinse, einer Objektivlinse, einem Polarisationsstrahlteiler oder einer zylindrischen Linse und einem Fotodetektor mit Lichtempfangsbereichen eines zuvor festgelegten Musters. Dieser optische Kopf 53 ist so vorgesehen, dass er dem Magnetkopf 54 bei dazwischen liegender magnetooptischer Disk 1 zugewandt ist. Zur Aufzeichnung von Daten auf der magnetooptischen Disk 1 wird der Magnetkopf 54 von einer Magnetkopf-Treiber- bzw. Steuerschaltung 66 des Aufzeichnungssystems angesteuert, wie dies später erläutert wird, um das modulierte Magnetfeld entsprechend den Aufzeichnungsdaten aufzuprägen und gleichzeitig das Laserlicht in eine Zielspur auf der magnetooptischen Disk 1 unter Vornahme einer thermomagnetischen Aufzeichnung entsprechend dem Magnetfeld-Modulationssystem abzustrahlen. Der optische Kopf 53 ermittelt außerdem den Fokussierungsfehler, beispielsweise durch das astigmatische Verfahren, während der Spur- bzw. Nachlauffehler durch das Gegentaktverfahren ermittelt wird. Wenn Daten von der magnetooptischen Disk 1 wiedergegeben werden, ermittelt der optische Kopf 53 den Fokussierungsfehler und den Spur- bzw. Nachlauffehler, und gleichzeitig ermittelt er die Differenz im Polarisationswinkel (Kerr-Drehwinkel) von der Zielspur des Laserlichts zur Erzeugung der Wiedergabesignale.
  • Ein Ausgangssignal des optischen Kopfes 53 wird zu einer HF-Schaltung 55 übertragen, welche aus dem Ausgangssignal des optischen Kopfes 53 die Fokussierungsfehler- und Spurfehlersignale extrahiert, um die extrahierten Signale an eine Servosteuerschaltung 56 abzugeben, während die wiedergegebenen Signale in Zwei-Pegel-Signale umgesetzt werden, die zu einem Decoder 71 des Wiedergabesystems übertragen werden.
  • Die Servosteuerschaltung 56 besteht beispielsweise aus einer Fokussierungs-Servosteuerschaltung, einer Spindelmotor-Servosteuerschaltung und einer Schraub-Servosteuerschaltung. Die Fokussierungs-Servosteuerschaltung nimmt eine Spursteuerung des optischen Systems des optischen Kopfes 53 vor, so dass die Fokussierungsfehlersignale zu Null verringert werden. Die Nachlauf-Servosteuerschaltung nimmt eine Nachlaufsteuerung des optischen Systems des optischen Kopfes 53 vor, so dass die Spur- bzw. Nachlauffehlersignale zu Null verringert werden. Die Spindelmotor-Servosteuerschaltung steuert den Spindelmotor 51 so, dass die magnetooptische Disk 1 mit einer zuvor festgelegten Drehzahl bzw. Drehgeschwindigkeit in Drehung versetzt wird, wie mit einer konstanten linearen Geschwindigkeit. Die Schraub-Servosteuerschaltung verschiebt den optischen Kopf 53 und den Magnetkopf 54 in die durch die Systemsteuereinrichtung 57 spezifizierte Zielspurposition der magnetooptischen Disk 1. Die Servosteuerschaltung 56, die diese verschiedenen Steuerungsoperationen ausführt, überträgt die die Operationszustände der verschiedenen Komponenten spezifizierenden Informationen durch die Servosteuerschaltung 56 gesteuert zu der Systemsteuereinrichtung 57 hin.
  • In der Systemsteuerschaltung 57 sind eine Tasteneingabe-Betätigungseinheit 58 und eine Anzeigeeinrichtung 59 untergebracht. Die Systemsteuereinrichtung 57 steuert das Aufzeichnungssystem und das Wiedergabesystem durch Auslösen einer Eingabeinformation mittels der Tasteneingabe-Betätigungseinheit 58. Die Systemsteuereinrichtung 57 überwacht außerdem die Aufzeichnungsposition und die Wiedergabeposition in der Aufzeichnungsspur, denen der optische Kopf 53 und der Magnetkopf 54 nachlaufen, und zwar auf der Grundlage der Sektor-basierten Adresseninformation, die von den Header-Zeit- oder Subcode-Q-Daten von der Aufzeichnungsspur der magnetooptischen Disk 1 wiedergegeben wird. Die Systemsteuereinrichtung 57 leitet außerdem die Steuerung zur Anzeige der Wiedergabezeit auf der Anzeigevorrichtung 59 auf der Grundlage des Datenkompressionsverhältnisses der Aufzeichnungs- und/oder Wiedergabevorrichtung und der Wiedergabepositionsinformation der Aufzeichnungsspur.
  • Zur Anzeige der Wiedergabezeit wird die Sektor-basierte Adresseninformation, die von der Aufzeichnungsspur der magnetooptischen Disk 1 durch die sogenannten Header-Zeit- oder durch die sogenannten Subcode-Q-Daten (absolute Zeitinformation) wiedergegeben wird, mit einem Reziprokwert des Datenkompressionsverhältnisses multipliziert, wie mit vier für die 1/4-Kompression, um die tatsächliche Zeitinformation zu ermitteln, die auf der Anzeigevorrichtung 59 angezeigt wird. Es sei darauf hingewiesen, dass zur Aufzeichnung in dem Fall, dass die absolute Zeitinformation beispielsweise vorab aufgezeichnet ist, die Aufzeichnungsspur der magnetooptischen Disk 1 im Zuge ei ner Neuformatierung diese zuvor formatierte absolute Zeitinformation lesen und mit dem Reziprokwert des Datenkompressionsverhältnisses multiplizieren kann, um die aktuelle Position hinsichtlich der aktuellen Aufzeichnungszeit anzuzeigen.
  • Sodann wird in dem Aufzeichnungssystem der Disk-Aufzeichnungs-/Wiedergabevorrichtung ein analoges Audio-Eingangssignal AIN von einem Eingangsanschluss 60 über ein Tiefpassfilter TPF 61 zu einem A/D-Wandler 62 übertragen, der sodann das analoge Audio-Eingangssignal AIN quantisiert. Das digitale Audiosignal vom dem A/D-Wandler 62 wird zu einem adaptiven Transformations-Codierungs-(ATC)-Codierer 63 übertragen. Andererseits wird das digitale Audio-Eingangssignal DIN von einem Eingangsanschluss 67 über eine digitale Eingangs-Schnittstellenschaltung (digitaler Eingang) 68 zu dem ATC-Codierer 63 übertragen. Der ATC-Codierer 63 verarbeitet die digitalen Audio-PCM-Daten, die mit der zuvor festgelegten Übertragungsrate übertragen und mittels des A/D-Wandlers 62 aus dem Eingangssignal AIN quantisiert sind, mit einer Bitkompression (Datenkompression) in Erfüllung der zuvor festgelegten Datenkompressionsrate. Die komprimierten Abgabe- bzw. Ausgangsdaten (ATC-Daten) von dem ATC-Codierer 63 werden zu einem Speicher 64 übertragen. Falls die Datenkompressionsrate beispielsweise 1/8 beträgt, wird die Datenübertragungsrate auf 1/8 der Datenübertragungsrate von 75 Sektoren/s gemäß dem oben erwähnten Standard des CD-DA-Formats verringert, das heißt auf 9,375 Sektoren/s.
  • Bezüglich des Speichers 64 wird das Schreiben von Daten und das Lesen von Daten durch die Systemsteuereinrichtung 57 gesteuert, und der betreffende Speicher wird als Pufferspeicher zur vorübergehenden Aufzeichnung der von dem ATC-Codierer 63 übertragenen ATC-Daten für eine Speicherung auf der Disk, falls erforderlich, genutzt. Dies heißt, dass dann, wenn die Datenkompressionsrate gegeben ist mit 1/8, die komprimierten Audiodaten, die von dem ATC-Codierer 63 geliefert werden, in ihrer Datenübertragungs- bzw. Datentransferrate auf 1/8 der Standard-CD-DA-Format-Datenübertragungsrate von 75 Sektoren/s oder auf 9,375 Sektoren/s verringert werden bzw. sind. Diese komprimierten Daten werden aufeinanderfolgend in den Speicher 64 geschrieben. Obwohl diese komprimierten Daten (RTC-Daten) lediglich mit einer Rate von einem Sektor von acht Sektoren aufgezeichnet zu werden brauchen, wie oben erörtert, wird eine Sektor-kontinuierliche Aufzeichnung, wie später erläutert, angewandt, da eine Aufzeichnung aller acht Sektoren unmöglich ist. Diese Aufzeichnung erfolgt in einer Burst-Weise mit derselben Datenübertragungsrate von 75 Sektoren/s wie der Standard-CD-DA-Format-Datenübertragungsrate unter Heranziehung eines Clusters, bestehend aus einer zuvor festgelegten Vielzahl von Sektoren, wie aus 32 zuzüglich mehrerer Sektoren unter Einfügung von Nicht-Aufzeichnungs-Zeitspannen.
  • Dies bedeutet, dass die ATC-Audiodaten mit dem Datenkompressionsverhältnis von 1/8 kontinuierlich bei niedriger Übertragungsrate von 9,375 (+75/8) Sektoren/Sekunde aus dem Speicher 64 in einer burstartigen Weise als Aufzeichnungsdaten mit der oben erwähnten Übertragungsrate von 75 Sektoren/Sekunde ausgelesen werden. Die Gesamt-Datenübertragungsrate der so ausgelesenen und aufgezeichneten Daten einschließlich der Nicht-Aufzeichnungs-Zeitspanne ist die oben erwähnte niedrige Rate von 9,375 Sektoren/Sekunde. Die momentane Datenübertragungsrate während der burstartigen Aufzeichnungsoperation ist jedoch die oben erwähnte Standardrate von 75 Sektoren/Sekunde. Falls die Drehzahl bzw. Drehgeschwindigkeit der Disk die oben erwähnte Standarddrehzahl bzw. -geschwindigkeit des CD-DA-Formats (konstante lineare Geschwindigkeit) ist, erfolgt die Aufzeichnung unter derselben Aufzeichnungsdichte und mit demselben Aufzeichnungsmuster wie jene des CD-DA-Formats.
  • Die ATC-Audiodaten, das sind die aus dem Speicher 64 in der burstartigen Weise mit der (augenblicklichen) Übertragungsrate von 75 Sektoren/Sekunde ausgelesenen Aufzeichnungsdaten, werden einem Codierer 65 zugeführt. In der von dem Speicher 64 an den Codierer 65 abgegebenen Datenfolge bildet eine kontinuierliche Aufzeichnungseinheit pro jeweiliger Aufzeichnung ein Cluster, welches aus einer Vielzahl von Sektoren, wie aus 32 Sektoren und verschiedenen Cluster-Verbindungssektoren besteht, die vor und hinter dem Cluster angeordnet sind. Diese Cluster-Verbindungssektoren sind so festgelegt, dass sie länger sind als die Verschachtelungslänge im Codierer 65, so dass eine Verschachtelung die Daten von anderen Clustern nicht beeinflussen kann.
  • Der Codierer 65 wendet eine Codierung zur Fehlerkorrektur, wie eine Paritäts-Anhängung und eine Verschachtelung oder eine EFM-Codierung bezüglich der Aufzeichnungsdaten an, die in einer burstartigen Weise aus dem Speicher 64 geliefert werden. Die durch den Codierer 65 codierten Aufzeichnungsdaten werden der Magnetkopf-Steuerschaltung bzw. -Treiberschaltung 66 zugeführt. Mit dieser Magnetkopf-Steuerschaltung 66 ist der Magnetkopf 54 verbunden, so dass der Magnetkopf 54 zur Ausübung des entsprechend den Aufzeichnungsdaten modulierten Magnetfeldes an die magnetooptische Platte 1 gesteuert wird.
  • Die Systemsteuereinrichtung 57 führt eine Speichersteuerung, wie oben beschrieben, in dem Speicher 64 aus, während sie außerdem die Aufzeichnungsposition zur kontinuierlichen Aufzeichnung der Aufzeichnungsdaten in einer burstartigen Weise aus dem Speicher 64 mittels dieser Speichersteuerung in der Aufzeichnungsspur in der magnetooptischen Disk 1 steuert. Zur Steuerung der Aufzeichnungsposition auf diese Art und Weise wird die in einer Burst-Weise aus dem Speicher 64 ausgelesene Aufzeichnungsposition durch die Systemsteuereinrichtung 57 überwacht, um ein Steuersignal, welches die Aufzeichnungsposition in der Aufzeichnungsspur der magnetooptischen Disk 1 angibt, an die Servosteuerschaltung 56 abzugeben.
  • Nunmehr wird das Wiedergabesystem erläutert. Dieses Wiedergabesystem ist für die Wiedergabe von Aufzeichnungsdaten gestaltet, die in der Aufzeichnungsspur der magnetooptischen Disk 1 durch das oben beschriebene Aufzeichnungssystem kontinuierlich aufgezeichnet sind. Somit enthält das Wiedergabesystem einen Decoder 71, dem ein Zwei-Pegel-Signal zugeführt wird, welches mittels einer HF-Schaltung 55 von dem Wiedergabe-Ausgangssignal erhalten wird, welches seinerseits von dem optischen Kopf 53 erhalten wird, der der Aufzeichnungsspur der magnetooptischen Disk 1 mittels eines Laserlichtstrahls nachläuft. Es sei darauf hingewiesen, dass nicht nur die magnetooptische Disk, sondern auch eine lediglich lesbare optische Disk, entsprechend der Kompaktdisk (CD), gelesen werden kann.
  • Der Decoder 71 ist eine Gegenstück-Vorrichtung zum Codierer 65 des oben beschriebenen Aufzeichnungssystems. Das Wiedergabe-Ausgangssignal, welches durch die HF-Schaltung 55 in das Zwei-Pegel-Signal umgesetzt ist, wird zur Fehlerkorrektur decodiert oder es wird einer EFM-Decodierung zur Wiedergabe der ATC-Audiodaten unterzogen, die die Datenkompressionsrate von 1/8 bei einer Übertragungsrate von 75 Sektoren/Sekunde aufweisen, was schneller ist als die normale Übertragungsrate. Die durch den Decoder 71 erhaltenen Wiedergabedaten werden einem Speicher 72 zugeführt.
  • In dem Speicher 72, dessen Einschreiben/Auslesen von Daten durch die Systemsteuereinrichtung 57 gesteuert wird, werden die von dem Decoder 71 mit der Übertragungsrate von 75 Sektoren/Sekunde gelieferten Wiedergabedaten in einer burstartigen Weise mit der Übertragungsrate von 75 Sektoren/Sekunde eingeschrieben. Im Speicher 72 werden die mit der oben erwähnten Übertragungsrate von 75 Sektoren/Sekunde eingeschriebenen oben erwähnten Wiedergabedaten kontinuierlich mit der Übertragungsrate von 9,375 Sektoren/Sekunde entsprechend der Datenkompressionsrate von 1/8 ausgelesen.
  • Die Systemsteuereinrichtung 57 führt eine Speichersteuerung zum Einschreiben der Wiedergabedaten in den Speicher 72 mit der Transfer- bzw. Übertragungsrate von 75 Sektoren/Sekunde aus, während die Wiedergabedaten aus dem Speicher 7 mit der Transfer- bzw. Übertragungsrate von 9,375 Sektoren/Sekunde ausgelesen werden. Die Systemsteuereinrichtung 57, welche die Speichersteuerung für den Speicher 72 ausführt, wie oben beschrieben, steuert die Wiedergabeposition zum kontinuierlichen Auslesen der in der burstartigen Weise eingeschriebenen Wiedergabedaten aus dem Speicher 72 durch die Speichersteuerung von der Aufzeichnungsspur der magnetooptischen Disk 1. Die Wiedergabe-Positionssteuerung wird durch die Wiedergabeposition der Wiedergabedaten überwacht, die in der burstartigen Weise aus dem Speicher 72 ausgelesen sind, und zwar mittels der Systemsteuereinrichtung 57 und durch Abgabe eines Steuersignals, welches die Wiedergabeposition in der Aufzeichnungsspur der optischen Disk 1 oder der magnetooptischen Disk 1 bezeichnet, an die Servosteuerschaltung 56.
  • Die ATC-Audiodaten, die aus dem Speicher 72 mit der Übertragungsrate von 9,375 Sektoren/Sekunde kontinuierlich ausgelesen werden, werden an einen ATC-Decoder 73 abgegeben. Dieser ATC-Decoder 73 ist eine Gegenstück-Vorrichtung zum ATC-Codierer 63 des Aufzeichnungssystems, und er gibt die digitalen 16-Bit-Audiodaten durch Dehnung der ATC-Daten um einen Faktor von acht wieder. Die digitalen Audiodaten von dem ATC-Decoder 73 werden an einen D/A-Wandler 74 abgegeben.
  • Der D/A-Wandler 74 setzt die von dem ATC-Decoder 73 her zugeführten digitalen Audiodaten in ein analoges Signal zur Bildung eines analogen Audio-Ausgangssignals AOUT um. Dieses analoge Audio-Ausgangssignal AOUT, welches von dem D/A-Wandler 74 erhalten wird, wird über ein Tiefpassfilter (TPF) 75 an einem Ausgangsanschluss 76 abgegeben.
  • Nunmehr wird die hocheffiziente Codierung im Einzelnen erläutert. Genauer gesagt wird das Verfahren der hocheffizienten Codierung eines digitalen Eingangssignals, wie eines Audio-PCM-Signals durch Verfahren bzw. Techniken einer Subbandcodierung (SBC), einer adaptiven Transformationscodierung (ATC) und einer adaptiven Bitzuweisung unter Bezugnahme auf 4 und folgende erläutert.
  • In der Informationscodierungsvorrichtung (Codierer 63 gemäß 3) zur Ausführung des Verfahrens für eine Codierung der Information (akustische Wellenformsignale) gemäß der vorliegenden Erfindung wird eine Eingangs-Signalwelle 110a in einer Wandler- bzw. Umsetzschaltung 111a in Signalfrequenzkomponenten 110b umgesetzt, wie dies in 4 veranschaulicht ist. Diese Signalfrequenzkomponenten 110b werden dann mittels einer Signalkomponenten-Codierungsschaltung 111b zur Erzeugung eines codierten Signals 110c codiert. Eine Codefolgen-Erzeugungsschaltung 111c erzeugt dann eine Codefolge 110d aus dem durch die Codefolgen-Erzeugungsschaltung 111c erzeugten codierten Signal 110c.
  • Die Umsetzschaltung 111a teilt das Eingangssignal 120a durch ein Bandaufteilungsfilter 112a in zwei Bänder auf, und die resultierenden beiden Bandsignale 120b, 120c werden durch Vorwärts-Orthogonal-Transformationsschaltungen 112b, 112c mittels einer MDCT-Transformation in Spektralsignalkomponenten 120d, 120e transformiert, wie dies in 5 gezeigt ist. Das Eingangssignal 120a entspricht dem Signalverlauf bzw. der Signalwelle 110a gemäß 4, während die Spektralsignalkomponenten 120d, 120e den Signalfrequenzkomponenten 110b entsprechen, wie sie in 4 angegeben sind. In der Umsetzschaltung 111a, wie sie in 5 gezeigt ist, betragen die Bandbreiten der beiden im Band aufgeteilten Signale 120b, 120c eine Hälfte der Bandbreite des Eingangssignals 120a, das heißt, dass das Eingangssignal 120a um 1/2 ausgedünnt ist. Selbstverständlich kann neben dem dargestellten Beispiel irgendein anderer Aufbau der Umsetzschaltung 111a verwendet werden. So kann das Eingangssignal beispielsweise durch eine MDCT-Transformation direkt in Spektralsignale transformiert werden, während das Eingangssignal auch durch eine DFT- oder DCT-Transformation anstelle der MDCT-Transformation transformiert werden kann. Obwohl das Eingangssignal in Frequenzkomponenten durch ein Bandaufteilungsfilter aufgeteilt werden kann, wird das Eingangssignal vorzugsweise durch die oben erwähnten Orthogonal-Transformationsverfahren in Frequenzkomponenten transformiert, da dann eine große Anzahl von Frequenzkomponenten mit einem geringeren Volumen an Verarbeitungsoperationen erhalten werden kann.
  • Die Signalkomponenten-Codierungsschaltung 111b normiert die Signalkomponenten 130a von einem zuvor festgelegten Band zu einem anderen durch eine Normierungsschaltung 113a, während die Quantisierungsfeinheitsinformation 130c aus den Signalkomponenten 130a durch die Quantisierungsfeinheits-Entscheidungsschaltung 113b berechnet wird, wie dies in 6 veranschaulicht ist. Die Quantisierungsschaltung 113c quantisiert die normierten Signale 130b von der Normierungsschaltung 113a auf der Grundlage der Quantisierungsfeinheitsinformation. Im übrigen entsprechen die Signalkomponenten 130a dem codierten Signal 110c von bzw. in 4. Das Ausgangssignal 130d enthält die Normierungs-Koeffizienteninformation für eine Normierung und die oben erwähnte Quantisierungsfeinheitsinformation zusätzlich zu den Quantisierungssignalkomponenten.
  • In der Informations-Decodierungsvorrichtung (Decoder 73 in 3) zur Regenerierung bzw. Neubildung der Audiosignale aus der mittels des oben beschriebenen Informationscodierers erzeugten Codefolge werden Codes 140b der Signalkomponenten aus einer Codefolge 140a durch eine Codefolge-Auflösungsschaltung 114a, wie in 7 gezeigt, extrahiert. Aus diesen Codes 140b werden die Signalkomponenten 140c mittels einer Codefolge-Decodierungsschaltung 114b wieder hergestellt, und aus den wieder hergestellten Signalkomponenten 140c werden akustische Wellensignale bzw. Wellenformsignale mittels einer Rückumsetzungsschaltung 114c wieder zurückgewonnen.
  • Diese Rückumsetzungsschaltung 114c des Informationsdecoders ist so aufgebaut, wie dies in 8 gezeigt ist, und die betreffende Schaltung ist der in 5 gezeigten Umsetzungs- bzw. Umsetzschaltung zugehörig. In der in 8 gezeigten Rückumsetzungsschaltung 114c nehmen Invers-Orthogonal-Transformationsschaltungen 115a, 115b eine inverse orthogonale Transformation bezüglich der Eingangssignale 150a bzw. 150b zur Wiederherstellung der Bandsignale vor, die dann mittels eines Bandzusammensetzungsfilters 115c zusammengesetzt werden. Die Eingangssignale 150a, 150b entsprechen einem Signal 140c, dessen Signalkomponenten durch die Signalkomponenten-Decodierungsschaltung 114b gemäß 7 wieder hergestellt worden sind. Ein Ausgangssignal 150e des Bandzusammensetzungsfilters 115c entspricht dem akustischen Wellenformsignal 140d gemäß 7.
  • Die Signalkomponenten-Decodierungsschaltung 114b gemäß 7 ist so aufgebaut, wie dies in 9 gezeigt ist, und sie wendet eine Dequantisierungs- und Denormierungsverarbeitung auf die Codes 140b von der Codefolgen-Auflösungsschaltung 114a, das sind Spektralsignale, an. In der Signalkomponenten-Decodierungsschaltung 114b, wie sie in 9 gezeigt ist, nimmt eine Dequantisierungsschaltung 116a eine Dequantisierung von Eingangscodes 160a vor, während die Denormierungsschaltung 116b eine Denormierung der Signale 160b vornimmt, die auf eine Dequantisierung hin erhalten wird, um Signalkomponenten 160c abzugeben. Die oben erwähnten Codes 160a entsprechen den Codes 140b von der Codefolgen-Auflösungsschaltung 114a gemäß 7, während die Ausgangssignalkomponenten 160c den Signalkomponenten 140c gemäß 7 entsprechen.
  • Die durch die Umsetzschaltung des oben beschriebenen Informationscodierers, wie in 5 gezeigt, erhaltenen Spektralsignalen sind so, wie sie beispielsweise in 10 gezeigt sind. Die in 10 gezeigten Spektralkomponenten bezeichnen absolute Werte der Spektralkomponenten durch eine MDCT-Transformation nach einer Pegelumsetzung um dB. Dies heißt, dass in diesem Informationscodierer das Eingangssignal von einem zuvor festgelegten Transformationsblock zu einem anderen in 64 Spektralkomponenten umgesetzt und normiert und hinsichtlich acht Bändern quantisiert wird, die hier als Codierungseinheiten bezeichnet werden, wie dies mit [1] bis [8] in 10 veranschaulicht ist. Falls die Quantisierungsfeinheit von einer Codierungseinheit zu einer anderen in Abhängigkeit davon variiert wird, wie die Frequenzkomponenten verteilt sind, ist eine Codierung mit wahrnehmbarem hohen Wirkungsgrad und Herabsetzung der Tonqualitätsverschlechterung auf ein Minimum gewährleistet.
  • 11 zeigt einen veranschaulichenden Aufbau einer Codefolge im Falle einer Codierung, wie sie oben beschrieben worden ist.
  • In der Codefolge gemäß dem gerade veranschaulichten Aufbau ist die Information angeordnet, bei der es sich um die Daten handelt, die für die Wiederherstellung der Spektralkomponenten des jeweiligen Transformationsblocks herangezogen werden und die in Verbindung mit einer Vielzahl von Rahmen codiert worden sind, deren jeder aus einer zuvor festgelegten Anzahl von Bits gebildet ist. Am vorderen Ende (Header) des jeweiligen Rahmens ist die Information angeordnet, die durch Steuerdaten gegeben ist, wie die zuvor codierten Codierungseinheiten und die Sync- bzw. Synchronisiersignale, die mit einer zuvor festgelegten Anzahl von Bits codiert sind. Die Header-Information wird von den Informationen gefolgt, die auf sequentielle Codierung der Quantisierungsfeinheitsdaten und der Normierungs-Koeffizientendaten der Codierungseinheiten in der Reihenfolge steigender Frequenz der Codierungseinheiten erhalten werden. Am hinteren Ende des jeweiligen Headers befinden sich Spektral-Koeffizientendaten, die auf der Grundlage der oben erwähnten Normierungs-Koeffizientendaten und Quantisierungsfeinheitsdaten von einer Codierungseinheit zu einer anderen normiert bzw. quantisiert sind, und zwar in der Reihenfolge zunehmender Frequenz der Codierungseinheiten.
  • Die Anzahl der Bits, die für eine Wiederherstellung der Spektralsignale des Transformationsblockes tatsächlich erforderlich sind, wird in Abhängigkeit von der Anzahl der codierten Codierungseinheiten und der Anzahl der Quantisierungsbits festgelegt, die durch die Quantisierungsfeinheitsinformation der jeweiligen Codierungseinheit spezifiziert sind, und sie kann von Rahmen zu Rahmen unterschiedlich sein. Lediglich die oben er wähnte erforderliche Anzahl von Bits vom vorderen Ende des jeweiligen Rahmens ist zum Zeitpunkt der Wiedergabe signifikant, wobei der übrige Bereich des jeweiligen Rahmens ein leerer Bereich ist, der die Wiedergabesignale nicht beeinflusst. Üblicherweise wird eine größere Anzahl von Bits zur Minimierung des leeren Bereiches des jeweiligen Bereiches effektiv genutzt.
  • Durch Codieren des jeweiligen Transformationsblockes in Verbindung mit dem Rahmen aus einer zuvor festgelegten Anzahl von Bits kann die Aufzeichnungsposition eines optionalen Transformationsblocks leicht berechnet werden, womit ein erleichterter beliebiger Zugriff ermöglicht ist, das heißt eine Datenwiedergabe von einer optionalen Position.
  • 12 und 13 veranschaulichen ein Beispiel des Aufzeichnungsformats im Falle einer chronologischen Aufzeichnung der Rahmendaten, die in 11 dargestellt sind, auf einem Aufzeichnungsträger. 12 zeigt ein Beispiel der abwechselnden Anordnung von Signalen zweier Kanäle, wie eines linken (L) Kanals und eines rechten (R) Kanals auf der Rahmenbasis, während 13 ein Beispiel zeigt, bei dem Ein-Kanal-Signale, die durch eine (L+R)/2-Operation der linken (L) und der rechten (R) Kanäle erzeugt werden (monaurale Signale, die von den linken und rechten Kanälen erzeugt sind) auf der Rahmenbasis angeordnet sind.
  • Durch Heranziehen des in 12 gezeigten Aufzeichnungsformats können die beiden Kanäle von L und R auf demselben Aufzeichnungsträger aufgezeichnet werden. Falls demgegenüber das Aufzeichnungsformat des Anordnens lediglich eines Kanals von (L+R)/2 auf der Rahmenbasis genutzt wird, wie dies in 13 veranschaulicht ist, wird eine Signalaufzeichnung/-wiedergabe für eine doppelte Zeitdauer im Vergleich zu dem Aufzeichnungsformat möglich, bei dem die beiden Kanäle von L und R abwechselnd auf der Rahmenbasis angeordnet sind, wie dies in 12 gezeigt ist, während die Wiedergabe ohne Komplizierung der Wiedergabeschaltung erleichtert werden kann.
  • Wenn das in 12 dargestellte Aufzeichnungsformat der Standardzeit-Modus genannt wird, kann das Aufzeichnungsformat, welches eine Langzeitaufzeichnung/-wiedergabe mit einer geringeren Anzahl von Kanälen ermöglicht, als Langzeit-Modus bezeichnet werden, der eine Aufzeichnung/Wiedergabe ermöglicht, die zweimal so lang ist wie beim oben beschriebenen Standardzeit-Modus. Falls bei dem Beispiel gemäß 12 einer der L- und R-Kanäle anstelle der beiden L- und R-Kanäle aufgezeichnet wird, ist die Signalaufzeichnungszeit zweimal so lang wie die Zeit, die zur Aufzeichnung der beiden L- und R-Kanäle erforderlich ist, wie dies in 12 gezeigt ist. Dieser Aufzeichnungsmodus kann auch als Langzeit-Modus bezeichnet werden.
  • Obwohl die vorstehende Beschreibung auf das Verfahren bzw. die Technik des unter Bezugnahme auf 11 erläuterten Codierungsverfahrens beschränkt ist, ist es auch möglich, den Codierungswirkungsgrad im Hinblick auf das Codierungsverfahren gemäß 11 weiter zu verbessern bzw. zu steigern.
  • So kann beispielsweise die sogenannte variable Längencodierung bzw. die Codierung mit variabler Länge, bei der eine kurze Codelänge und eine längere Codelänge den quantisierten Spektralsignalen zugewiesen werden, die mit höherer oder niederer Häufigkeit auftreten, zur Steigerung des Codierungswirkungsgrades angewandt werden.
  • Falls der oben erwähnte, zuvor festgelegte Transformationsblock bei der Codierung der Eingangssignale, das heißt die Zeitblocklänge für eine orthogonale Transformation auf einen längeren Wert festgelegt ist, dann kann überdies die Menge der untergeordneten Information, nämlich die Quantisierungsfeinheitsinformation oder die Normierungs-Koeffizienteninformation relativ pro Block verringert werden, während die Frequenzauflösung verbessert ist. Damit ist es möglich, die Quantisie rungsfeinheit auf der Frequenzachse feiner zu steuern, womit der Codierungswirkungsgrad erhöht ist.
  • In der internationalen Veröffentlichung WO94/28633 ist von der Anmelderin der vorliegenden Anmeldung ferner ein Verfahren zur Abtrennung von wahrnehmbar kritischen Tonsignalkomponenten von den Spektralsignalkomponenten zur Codierung unabhängig von anderen Spektralsignalkomponenten angegeben. Falls dieses Verfahren angewandt wird, können Audiosignale oder dergleichen effizient mit einem hohen Kompressionsverhältnis ohne nennenswerte Erzeugung von wahrnehmbarer Signalverschlechterung effizient codiert werden.
  • Das Verfahren zur Abtrennung und Codierung der Tonsignalkomponenten wird unter Bezugnahme auf 14 erläutert. Bei dem Beispiel gemäß 14 ist der Zustand veranschaulicht, in welchem drei Tonkomponentensätze als Tonsignalkomponenten von den Spektralsignalkomponenten abgetrennt worden sind. Die Signalkomponenten, welche diese Tonkomponentensätze bilden, werden zusammen mit den jeweiligen Positionsdaten der Tonkomponenten auf der Frequenzachse codiert.
  • Generell müssen die Signalkomponenten der Tonkomponenten, in denen die Signalenergie innerhalb einer kleinen Anzahl von Spektralkomponenten konzentriert ist, in bzw. mit einem extrem hohen Grad an Feinheit quantisiert werden. Die Spektralkomponenten in jeder Codierungseinheit, die von Tonkomponenten befreit sind (Nicht-Tonspektralsignalkomponenten), können mit einer relativ geringen Anzahl von Bits ohne eine Verschlechterung der wahrnehmbaren Tonqualität quantisiert werden.
  • Obwohl lediglich eine relativ kleine Anzahl von Spektralsignalkomponenten in 14 gezeigt ist, und zwar zur Vereinfachung der Zeichnung, ist die Signalenergie in einigen wenigen Signalkomponenten von mehreren zehn Signalkomponenten konzentriert, die eine bestimmte Codierungseinheit bilden. Daher ist die Datenmenge als Ergebnis der Abtrennung der Tonkomponenten nicht signifikant erhöht, so dass der Codierungswirkungsgrad insgesamt durch Abtrennen der Tonkomponenten verbessert bzw. gesteigert werden kann.
  • 15 zeigt einen veranschaulichenden Aufbau einer Codefolge im Falle der Codierung durch das unter Bezugnahme auf 14 erläuterte Verfahren. Bei dem vorliegenden veranschaulichenden Aufbau sind am vorderen Ende jedes Rahmens als Header-Teil die Informationen angeordnet, die Steuerdaten, wie Synchronisiersignale bzw. Sync-Signale und die codierte Anzahl der Codierungseinheiten umfassen, welche mit einer zuvor festgelegten Anzahl von Bits codiert sind. Anschließend an den Header-Teil ist die Information angeordnet, die aus codierten Tonkomponentendaten als Tonkomponentendaten besteht.
  • Als Tonkomponentendaten ist die Information, bei der es sich um die Anzahl der Signalkomponenten in den Tonkomponenten handelt, zuerst angeordnet; auf diese Information folgen die Information, bei der es sich um die codierte Positionsinformation der Tonkomponenten auf der Frequenzachse handelt, die Information, bei der es sich um die codierte Information bezüglich der Normierungskoeffizienten handelt, und die Information, welche die normierten, quantisierten und codierten Tonsignalkomponenten in dieser Reihenfolge darstellt.
  • Im Anschluss an die Tonkomponentendaten ist die Information angeordnet, bei der es sich um die codierten Daten des Restsignals handelt, welches nach Subtraktion der Tonsignalkomponenten von den ursprünglichen Spektralsignalkomponenten übrig geblieben ist. Dieses Restsignal kann auch als Rauschsignalkomponenten bezeichnet werden. Dieses Restsignal besteht aus Quantisierungsfeinheitsdaten und Normierungs-Koeffizientendaten der jeweiligen Codierungseinheit und aus Spektralkomponentensignalen, die auf der Grundlage der Normierungs-Koeffizientendaten und der Quantisierungsfeinheitsdaten normiert und quantisiert sind (das sind andere Signalkomponenten als die Tonkomponenten), welche in der Reihenfolge zunehmender Frequenz der Codierungseinheiten codiert sind. Es sei angemerkt, dass die Spektralsignalkomponenten der Tonkomponenten und von anderen Signalkomponenten (Koeffizientendaten) durch die VLC-Codierung codiert sind.
  • 16 zeigt ein veranschaulichendes Beispiel der Signalkomponenten-Codierungsschaltung 111b gemäß 4, wenn die Tonsignalkomponenten von den oben erwähnten jeweiligen Signalkomponenten abgetrennt werden.
  • In der in 16 dargestellten Signalkomponenten-Codierungsschaltung 111b werden die von der Umsetzschaltung 111a gemäß 4 übertragenen Signalkomponenten 170a (110b) zu einer Tonkomponenten-Abtrennschaltung 117a übertragen. Die Signalkomponenten 170a werden in Tonsignalkomponenten 170b und andere Signalkomponenten 170c (Nicht-Tonsignalkomponenten) aufgeteilt. Die Tonsignalkomponenten 170b werden zu einer Tonkomponenten-Codierungsschaltung 117b übertragen, während die Nicht-Tonsignalkomponenten 170c zu einer Nicht-Tonkomponenten-Codierungsschaltung 117c übertragen werden. Die Tonkomponenten-Codierungsschaltung 117b und die Nicht-Tonkomponenten-Codierungsschaltung 117c codieren die ihnen zugeführten Signalkomponenten, um resultierende Ausgangssignale 170d bzw. 170e abzugeben. Die Tonkomponenten-Codierungsschaltung 117b erzeugt die Information, welche die Tonkomponentendaten gemäß 15 darstellt, und zwar zur selben Zeit, zu der sie die Information codiert, welche die Tonkomponentendaten darstellt. Die Signalcodierungsanordnungen in der Tonkomponenten-Codierungsschaltung 117b und in der Nicht-Tonkomponenten-Codierungsschaltung 117c sind dieselben wie jene, die in 6 gezeigt sind.
  • 17 zeigt ein veranschaulichendes Beispiel der Signalkomponenten-Decodierungsschaltung 114b von 7 in dem Fall, dass die Tonsignalkomponenten von den jeweiligen Signalkomponenten abgetrennt worden sind.
  • In der in 17 dargestellten Signalkomponenten-Decodierungsschaltung 114b wird der von der Codefolge-Auflösungsschaltung 114a gemäß 7 gelieferte Code 140b aus Tonkomponentendaten 180a und Nicht-Tonkomponentendaten 180b gebildet, wobei diese Daten zu der zugehörigen Tonkomponenten-Decodierungsschaltung 118a bzw. zu der zugehörigen Nicht-Tonkomponenten-Decodierungsschaltung 118b übertragen werden. Die Tonkomponenten-Decodierungsschaltung 118a decodiert die Tonsignalkomponenten aus den in 15 dargestellten Tonkomponentendaten, um resultierende Tonsignalkomponenten 180c abzugeben. Die Nicht-Tonkomponenten-Decodierungsschaltung 118b decodiert die Tonsignalkomponenten aus den Nicht-Tonkomponentendaten, um resultierende Nicht-Tonsignalkomponenten 180d abzugeben. Diese Tonsignalkomponenten 180c und Nicht-Tonsignalkomponenten 180d werden beide zu einer Spektralsignal-Zusammensetzungsschaltung 118c übertragen, die sodann die Tonsignalkomponenten und die Nicht-Tonsignalkomponenten auf der Grundlage der oben erwähnten Positionsdaten zusammensetzt, um die resultierenden Signalkomponenten 180e abzugeben. Die Decodierungsanordnungen der Tonkomponenten-Decodierungsschaltung 118a und der Nicht-Tonkomponenten-Decodierungsschaltung 118b sind dieselben wie jene, die in 9 dargestellt sind.
  • Es sei angenommen, dass ein Codierungsverfahren, das hier als alter Standard oder als A-Codec bezeichnet wird, entwickelt worden ist, dass das Aufzeichnungsformat auf einer Disk unter Heranziehung dieses Verfahrens standardisiert bzw. genormt worden ist und dass anschließend ein Codierungsverfahren von höherem Wirkungsgrad, welches vom A-Codec erweitert und hier als neuer Standard oder B-Codec bezeichnet ist, entwickelt worden ist. In diesem Falle können durch den B-Codec codierte Signale auf demselben Typ von Disk aufgezeichnet werden wie auf jener, auf der Signale durch den A-Codec aufgezeichnet werden bzw. sind. Falls Signale durch den B-Codec wie jene durch den A-Codec aufgezeichnet werden können, kann die Disk-Nutzung in vorteilhafter Weise erweitert werden, da Signale während einer längeren Zeitspanne auf der Disk aufgezeichnet werden können oder da die Signale mit einer höheren Tonqualität aufgezeichnet werden können.
  • Bei dem in der japanischen Patentanmeldung 9-42514 angegebenen Verfahren ist dies so realisiert, dass im Falle einer Codefolge, die zuvor so konzipiert war, um eine Langzeit-Wiedergabe für eine geringe Anzahl von Kanälen zu ermöglichen, wie im Falle des in 13 dargestellten Aufzeichnungsformats, oder um die Aufzeichnung von monauralen Signalen zu ermöglichen, wie dies in 12 dargestellt ist, eine geringere Anzahl von Bits als die Gesamtanzahl von Bits, die dem jeweiligen Rahmen zugeteilt werden können, der geringen Anzahl von Kanälen zugeteilt wird. Anders ausgedrückt heißt dies, dass eine geringere Anzahl von Bits als die Gesamtanzahl von Bits, die dem jeweiligen Rahmen zugeteilt werden kann, für den A-Codec genutzt wird, so dass in dem Rahmen ein leerer Aufzeichnungsbereich hervorgerufen wird und dass Signale der Kanäle, die durch die dem alten Standard genügende Vorrichtung nicht wiedergegeben werden, das sind B-Codec-Signale, in dem so hervorgerufenen leeren Bereich aufgezeichnet werden, um eine Mehrkanal-Aufzeichnung/-Wiedergabe (Aufzeichnungs/Wiedergabe von beiden A- und B-Codecs) für den Langzeit-Modus zu ermöglichen. Falls bei diesem Verfahren die Signale des Kanals, die durch die dem alten Standard genügende Aufzeichnungsvorrichtung nicht wiedergegeben werden, durch ein effizienteres Verfahren codiert sind als die Signale des Kanals, der durch die dem alten Standard genügende Aufzeichnungsvorrichtung wiedergegeben wird, ist es möglich, die Herabsetzung der Tonqualität zu unterdrücken, die ansonsten durch die Verringerung in der Anzahl der Bits hervorgerufen wird, welche den Signalen zugeteilt sind, die durch die dem alten Standard genügende Aufzeichnungsvorrichtung für ein Mehrkanalsystem zugewiesen sind.
  • 18 zeigt ein veranschaulichendes Beispiel einer Codefolge, die auf eine Anwendung des in der oben bezeichneten japanischen Patentanmeldung 9-42514 angegebenen Verfahrens erhalten wird.
  • Bei dem Beispiel gemäß 18 wird jeder Rahmen, der aus einer zuvor festgelegten Anzahl von Bits besteht, in zwei Bereiche aufgeteilt. Genauer gesagt werden die Signale des Kanals (L+R)/2, die durch das oben erwähnte A-Codec-Codierungsverfahren codiert sind, in Bereichen 1 und 3 aufgezeichnet, während Signale des Kanals (L-R)/2, die durch das oben erwähnte B-Codec-Codierungsverfahren codiert sind, in den schraffierten Bereichen 2 und 4 aufgezeichnet werden, welche die oben erwähnten leeren Aufzeichnungsbereiche darstellen.
  • Das A-Codec-Codierungsverfahren entspricht dem unter Bezugnahme auf 11 erläuterten Codierungsverfahren. Das B-Codec-Codierungsverfahren kann durch ein Codierungsverfahren veranschaulicht werden, welches Codierungssignale umfasst, die durch das in 15 veranschaulichte Codierungsverfahren in Spektralsignalkomponenten mit einer Transformationsblocklänge umgesetzt sind, welche gleich dem Zweifachen jener des A-Codecs durch das bzw. bei dem in 15 veranschaulichte Codierungsverfahren ist. Es sei darauf hingewiesen, dass die Umsetzungsblocklänge des B-Codecs das Zweifache der Umsetzungsblocklänge des A-Codecs beträgt, so dass die dem Umsetzungsblock entsprechenden Signale über zwei Rahmen aufgezeichnet werden bzw. sind.
  • Bei dem Beispiel gemäß 18 wird das Codierungsverfahren fester Länge für den A-Codec angewandt. Deshalb kann die Anzahl der Bits, die in einer Codefolge verwendet werden, welche durch das oben erwähnte A-Codec-Codierungsverfahren (nachstehend als A-Codec-Codefolge bezeichnet) erhalten wird, leicht berechnet werden. Falls die Anzahl der von dem A-Codec benutzten Bits berechnet werden kann, kann die vordere Position der Codefolge, die durch das oben erwähnte B-Codec-Codierungsverfahren erhalten wird (nachstehend als B-Codec-Codefolge bezeichnet), leicht berechnet werden. Alternativ kann die B-Codec-Codefolge für den Anfang vom hinteren Ende eines Rahmens angepasst werden. In diesem Fall kann die vordere Position der B-Codec-Codefolge sogar dann leicht bekannt sein, wenn beispielsweise ein Codierungsverfahren mit variabler Codierungslänge als A-Codec-Codierungsverfahren angewandt wird. Falls die vordere Position der B-Codefolge auf diese Weise leicht berechnet werden kann, wird es für die Wiedergabevorrichtung, die sowohl dem A-Codec als auch dem B-Codec genügt (die dem neuen Standard genügende Wiedergabevorrichtung), möglich, beide Codefolgen prompt durch eine Paralleloperation auszuführen, was somit eine schnelle Verarbeitung ermöglicht.
  • Falls das A-Codec-Codierungsverfahren die Information bezüglich der Anzahl der Codierungseinheiten enthält, wie in 11 veranschaulicht, und die Bandbreite des durch das A-Codec-Codierungsverfahren codierten Kanals zur Sicherung eines Bereichs für die Aufzeichnung von Signalen von anderen Kanälen (leerer Aufzeichnungsbereich), wie oben erwähnt, eingeengt ist, können die Quantisierungsfeinheitsdaten oder die Normierungs-Koeffizientendaten beispielsweise auf der Seite hoher Frequenz vorteilhafterweise weggelassen werden. In diesem Falle kann die Anzahl der für die Codierung durch das A-Codec-Codierungsverfahren verwendeten Bits leicht berechnet werden.
  • Bei der oben beschriebenen Ausführungsform gemäß 18 werden die (L+R)/2-Kanal-Signale als eine A-Codec-Codefolge aufgezeichnet, während die (L-R)/2-Kanal-Signale als eine B-Codec-Codefolge aufgezeichnet werden. Falls lediglich der Bereich, in welchem beispielsweise die A-Codec-Signale aufgezeichnet sind, wiedergegeben und decodiert wird, können somit monaurale (L+R)/2-Signale wiedergegeben werden, während in dem Fall, dass sowohl ein Bereich, in welchem A-Codec-Signale aufgezeichnet sind, als auch ein Bereich, in welchem B-Codec-Signale aufgezeichnet sind, wiedergegeben und decodiert werden und die Summe der beiden decodierten Signale erhalten wird, die rechten (R) Kanal-Signale wiedergegeben werden. Falls andererseits die Differenz zwischen den beiden decodierten Signalen ermittelt wird, können die linken (L) Kanal-Signale wie dergegeben werden, wodurch eine Stereowiedergabe ermöglicht ist.
  • Die dem alten Standard genügende Wiedergabevorrichtung ignoriert in bzw. auf dem Aufzeichnungsträger, auf dem die Codefolge gemäß 18 aufgezeichnet ist, den oben beschriebenen Bereich, der durch das B-Codec-Codierungsverfahren codiert ist, so dass monaurale Signale von dem Aufzeichnungsträger wiedergegeben werden können, auf dem die oben erwähnte Codefolge aufgezeichnet ist.
  • Andererseits können Stereosignale von einem Aufzeichnungsträger, auf dem die in 18 dargestellte Codefolge aufgezeichnet ist, mittels einer Wiedergabevorrichtung wiedergegeben werden, die sowohl eine A-Codec-Decodierungsschaltung als auch eine B-Codec-Decodierungsschaltung (dem neuen Standard genügende Wiedergabevorrichtung) enthält. Wenn somit, nachdem die dem alten Standard genügende Wiedergabevorrichtung in eine weit verbreitete Nutzung gelangt ist, die dem neuen Standard genügende Wiedergabevorrichtung das in 18 dargestellte Codierungsverfahren als Standard für eine Stereo-Wiedergabe eingeführt hat, kann die dem alten Standard genügende Wiedergabevorrichtung monaurale Signale wiedergeben. Da die Decodierungsschaltung zur Decodierung der A-Codec-Codes durch Hardware in einem relativ kleinen Maßstab implementiert werden kann, kann die eine solche Decodierungsschaltung enthaltende Wiedergabevorrichtung unterdessen unter geringen Kosten hergestellt werden.
  • Es sei darauf hingewiesen, dass dann, wenn die Signale des A-Codecs und des B-Codecs mit einer kleineren Anzahl von Bits codiert sind als der einem Rahmen zuteilbaren Anzahl von Bits, die Anzahl der der Codierung des A-Codecs zugeteilten Bits verringert ist im Vergleich zum Fall der Zuteilung der Gesamtheit von Bits eines Rahmens zur Codierung des A-Codecs, womit die Tonqualität im Falle der Wiedergabe durch die dem alten Standard genügende Wiedergabevorrichtung sinkt. Bei dem in der oben erwähnten japanischen Patentanmeldung 9-42514 angegebenen Verfahren wird jedoch ein Codierungsverfahren für den B-Codec angewandt, welches im Codierungswirkungsgrad höher ist als das Codierungsverfahren für den A-Codec, so dass ein Transformationsblock von längerer Zeitdauer angewandt wird und eine geringere Anzahl von Bits für das Codierungsverfahren gemäß dem B-Codec genügt; folglich kann eine größere Anzahl von Bits für das Codierungsverfahren gemäß dem A-Codec genutzt werden, womit die Verschlechterung in der Tonqualität vermindert ist.
  • 19 zeigt einen veranschaulichenden Aufbau einer Codierungsschaltung zur Codierung einer Codefolge gemäß 18 unter Heranziehung des oben beschriebenen Verfahrens der vorliegenden Erfindung.
  • In 19 werden ein L-Kanal-Eingangssignal 190a und ein R-Kanal-Eingangssignal 190b mittels einer Kanalumsetzschaltung 119a in ein (L+R)/2 entsprechendes Signal 190c und in ein (L-R)/2 entsprechendes Signal 190d umgesetzt. Das (L+R)/2-Signal 190c und das (L-R)/2-Signal 190d werden zu einer ersten Codierungsschaltung 119b bzw. zu einer zweiten Codierungsschaltung 119c übertragen.
  • Die erste Codierungsschaltung 119b ist der Signalkomponenten-Codierungsschaltung 111b gemäß 4 äquivalent, die den Aufbau gemäß 6 besitzt. Bei dieser ersten Codierungsschaltung 119b wird das oben beschriebene A-Codec-Codierungsverfahren angewandt. Andererseits weist die zweite Codierungsschaltung 119c eine Transformationsblocklänge auf, die zweimal so lang ist wie die erste Codierungsschaltung 119b, und sie ist der Signalcodierungsschaltung 111b äquivalent, welche den Aufbau gemäß 16 besitzt. Bei dieser zweiten Codierungsschaltung 119b wird das oben beschriebene B-Codec-Codierungsverfahren angewandt. Die A-Codec-Codefolge 190e der ersten Codierungsschaltung 119b und die B-Codefolge 190f der zweiten Codierungsschaltung 119c werden beide zu einer Codefolgen-Erzeugungsschaltung 119d übertragen.
  • Diese Codefolgen-Erzeugungsschaltung 119d erzeugt eine Codefolge, wie in 18 gezeigt, aus den Codefolgen 190e, 190f, um die erzeugte Codefolge als Ausgangs-Codefolgesignal 190g abzugeben.
  • 20 zeigt den Arbeitsablauf für die Codefolge-Erzeugungsschaltung 119d gemäß 19, um eine Codefolge gemäß 18 zu erzeugen.
  • In 20 wird beim Schritt S101 die Rahmennummer F zu bzw. mit 1 initialisiert. Beim nächsten Schritt S102 wird eine A-Codec-Codefolge 190e von der ersten Codierungsschaltung 119b empfangen. Beim Schritt S103 wird entschieden, ob die Rahmennummer F ungeradzahlig oder geradzahlig ist. Falls die Rahmennummer nicht geradzahlig ist, geht die Verarbeitung weiter zum Schritt S106, und falls die Rahmennummer geradzahlig ist, geht die Verarbeitung weiter zum Schritt S104.
  • Beim Schritt S104 wird eine B-Codec-Codefolge 190f von der zweiten Codierungsschaltung 119c empfangen. Beim nächsten Schritt S105 wird die oben erwähnte Codefolge gemäß 18 aus den Codefolgen 190e, 190f zusammengesetzt.
  • Beim Schritt S106 wird geprüft, ob die Verarbeitung für sämtliche Rahmen zu einem Abschluss gelangt ist oder nicht. Falls das Ergebnis JA lautet, wird die Verarbeitung gemäß 20 beendet, und ansonsten wird die Rahmennummer F beim Schritt S107 um 1 inkrementiert, bevor die Verarbeitung zum Schritt S102 zurückkehrt, um die obige Verarbeitung zu wiederholen.
  • Bei der Verarbeitung gemäß 20 beginnt die Rahmennummer F bei bzw. mit 1. Da die Verarbeitungseinheit beim Codierungsverfahren für den B-Codec durch zwei Rahmen gegeben ist, was das Zweifache dessen ist, was beim A-Codec-Codierungsverfahren verwendet wird, wird die Codefolge indessen alle zwei Rahmen erzeugt.
  • 21 zeigt einen veranschaulichenden Aufbau einer Decodierungsschaltung der dem neuen Standard genügende Wiedergabevorrichtung, die zur Decodierung der Codefolge gemäß 18 geeignet ist, welche durch das oben beschriebene Codierungsverfahren der vorliegenden Erfindung erzeugt ist.
  • In 21 wird eine Eingangs-Codefolge 200a, bei der es sich um eine Codefolge gemäß 18 handelt, durch eine Codefolge-Aufteilungsschaltung 201a in die A-Codec-Codefolge 200b und eine B-Codec-Codefolge 200c aufgeteilt, und diese Codefolgen werden zu einer ersten Decodierungsschaltung 201b bzw. zu einer zweiten Decodierungsschaltung 201c übertragen.
  • Die erste Decodierungsschaltung 201b ist der Signalkomponenten-Decodierungsschaltung 114b von 7 äquivalent, und sie arbeitet zur Decodierung der A-Codec-Codes. Die zweite Decodierungsschaltung 201c, die eine Umsetzungsblocklänge aufweist, welche das Zweifache jener der zweiten Decodierungsschaltung 201b beträgt, ist der Signalkomponenten-Decodierungsschaltung 114b äquivalent, die den Aufbau von 7 besitzt und die zur Decodierung der B-Codec-Codes arbeitet. Ein durch die erste Decodierungsschaltung 201b decodiertes Signal 200d ist dem durch (L+R)/2 gegebenen Signal 190c äquivalent, während ein durch die zweite Decodierungsschaltung 201c decodiertes Signal 200e dem durch (L-R)/2 gegebenen Signal 190d äquivalent ist.
  • Da das durch (L+R)/2 gegebene Signal 200d und das durch (L-R)/2 gegebene Signal 200e von unterschiedlichen Umsetzungsblocklängen sind und folglich unterschiedliche Verarbeitungszeitverzögerungen besitzen, werden das durch (L+R)/2 gegebene Signal 200d von der ersten Decodierungsschaltung 201b und das durch (L-R)/2 gegebene Signal 200e von der zweiten Decodierungsschaltung 201c zu einer Speicherschaltung 201d bzw. zu einer Speicherschaltung 201e übertragen, wobei in diesen Speicherschaltungen die oben erwähnten Verarbeitungszeitverzöge rungen absorbiert werden. Das durch (L+R)/2 gegebene Signal 200f und das durch (L-R)/2 gegebene Signal 200e, die durch die Speicherschaltungen 201d bzw. 201e gelangt sind, werden zu einer Kanalumsetzschaltung 201f übertragen.
  • Diese Kanalumsetzschaltung 201f summiert das (L+R)/2-Signal 200f und das (L-R)/2-Signal 200g, um ein L-Kanal-Signal 200h zu erzeugen, während sie das (L-R)/2-Signal 200g von dem (L+R)/2-Signal 200f subtrahiert, um ein R-Kanal-Signal 200i zu erzeugen; diese Signale werden als L- bzw. R-Kanal-Signale abgegeben.
  • 22 veranschaulicht den Verarbeitungsablauf, wenn die Codefolge-Aufteilungsschaltung bzw. -Abtrennschaltung 201a gemäß 21 die Codefolge von 18 abtrennt.
  • In 22 wird beim Schritt 201 die Rahmennummer F1 mit 1 initialisiert. Bei Schritt S202 wird die zu der ersten Decodierungsschaltung 201b zu übertragende A-Codec-Codefolge abgetrennt und übertragen. Beim Schritt S203 wird überprüft, ob die Rahmennummer bzw. -zahl F ungeradzahlig oder geradzahlig ist. Falls die Rahmennummer F nicht ungeradzahlig ist, geht die Verarbeitung weiter zum Schritt S205, und andernfalls geht die Verarbeitung weiter zum Schritt S204.
  • Beim Schritt S204 wird die B-Codec-Codefolge zur Übertragung zu der zweiten Decodierungsschaltung 201c abgetrennt und übertragen.
  • Beim Schritt S205 wird überprüft, ob die Verarbeitung für sämtliche Rahmen zu einem Abschluss gelangt ist oder nicht. Falls das Ergebnis JA lautet, wird die Verarbeitung gemäß 22 abgeschlossen, und ansonsten wird die Rahmennummer F beim Schritt S206 um 1 inkrementiert, bevor die Verarbeitung zum Schritt S202 zurückkehrt, um die obige Verarbeitung zu wiederholen.
  • Bei der Verarbeitung gemäß 22 beginnt die Rahmennummer F bei 1. Da die Verarbeitungseinheit des Codierungsverfahrens für den B-Codec jedoch zwei Rahmen beträgt, was das Zweifache von dem des A-Codec-Codierungsverfahrens ist, wird die Codefolge alle zwei Rahmen abgetrennt.
  • Bei der obigen Beschreibung der bevorzugten Ausführungsform werden lediglich Signale eines zusätzlichen Kanals (B-Codec-Signale) in einem leeren Aufzeichnungsbereich des jeweiligen Rahmens aufgezeichnet. Wie in Verbindung mit dem Stand der Technik erörtert, entstehen zuweilen Probleme hinsichtlich des Quantisierungsrauschens, welches auf die Codierung hin erzeugt wird, in Abhängigkeit von der Art von Stereosignalen.
  • Nachstehend wird ein die vorliegende Erfindung verkörperndes Verfahren zur Lösung dieses Problems erläutert.
  • 23 zeigt eine Ausführungsform einer Codierungsvorrichtung gemäß der vorliegenden Erfindung. Es sei darauf hingewiesen, dass der in 23 gezeigte Aufbau ähnlich jenem der Codierungsvorrichtung von 19 ist, allerdings mit Ausnahme einer adaptiven Kanalumsetzungsschaltung 202a.
  • In 23 werden ein L-Kanal-Eingangssignal 210a und ein R-Kanal-Eingangssignal 210b durch die adaptive Kanalumsetzungsschaltung 202a mittels einer adaptiven Kanalumsetzung verarbeitet, wie dies anschließend erläutert wird. Genauer gesagt werden das L-Kanal-Eingangssignal 210a und das R-Kanal-Eingangssignal 210b durch die adaptive Kanalumsetzungsschaltung 202a in ein (L'+R')/2-Signal 210c und in ein (L'-R')/2-Signal 210d umgesetzt, was anschließend erläutert wird. Das (L'+R')/2-Signal 210c und das (L'-R')/2-Signal 210d werden zu einer ersten Codierungsschaltung 202b bzw. zu einer zweiten Codierungsschaltung 202c übertragen.
  • Die erste Codierungsschaltung 202b ist vom selben Aufbau wie die erste Codierungsschaltung 119b von 19, und das Codie rungsverfahren des A-Codecs wird angewandt. Die zweite Codierungsschaltung 202c weist denselben Aufbau auf wie die zweite Codierungsschaltung 119c von 19. Eine A-Codec-Codefolge 210e der ersten Codierungsschaltung 202b und eine B-Codec-Codefolge 210f der zweiten Codierungsschaltung 202c werden beide zu einer Codefolge-Erzeugungsschaltung 202d übertragen.
  • Diese Codefolge-Erzeugungsschaltung 202d weist denselben Aufbau auf wie die Codefolge-Erzeugungsschaltung 119b von 19, und sie gibt auf die Codefolgen 210e und 210f hin ein Ausgangs-Codefolgensignal 210g analog dem Ausgangs-Codefolgensignal 190g von 19 ab.
  • 24 zeigt einen bestimmten Aufbau der adaptiven Kanalumsetzschaltung 202a von 23. In der adaptiven Kanalumsetzschaltung 202a gemäß 24 beträgt die Verarbeitungseinheit des zweiten Codierungsverfahrens, das ist der B-Codec, das Zweifache jener des ersten Codierungsverfahrens, das ist der A-Codec. Daher tritt die Kanalumsetzungverarbeitung in der adaptiven Kanalumsetzungsschaltung 202a alle zwei Rahmen auf.
  • Ein L-Kanal-Eingangssignal 210a und ein R-Kanal-Eingangssignal 210b werden zu einer Kanalkorrelations-Koeffizientenberechnungsschaltung 203a bzw. zu einer Kanalmischschaltung 203b übertragen. Die Kanalkorrelations-Koeffizientenberechnungsschaltung 203a berechnet die Kanal-Korrelationskoeffizienten R_c entsprechend der folgenden Gleichung: R_c = S_lr/(S_l·S_r),worin S_l und S_r Standardabweichungen der L- und R-Kanäle angeben und wobei S_lr die Kovarianz der L- und R-Kanäle angibt. Für den Kanal-Korrelationskoeffizienten wird ein Wert angenommen, der von –1,0 bis 1,0 reicht. Dies heißt, dass bezüglich des Kanal-Korrelationskoeffizienten der Wert von 1,0 und –1,0 angenommen wird, falls die zunehmenden und abnehmenden Zustände der beiden Kanäle vollständig einander gleich sind, während andererseits ein Wert nahe bei Null angenommen wird, wenn, wie auch immer, keine Korrelation dort vorliegt. Dies heißt, dass R_c = 1,0 und R_c = –1,0 im Falle eines monauralen Signals beträgt, bei dem beide Kanäle einander gleich sind, und ein Stereosignals ist, bei dem die beiden Kanäle von entgegengesetzter Phase zueinander sind. Bei den üblichen Stereosignalen weist R_c einen Wert auf, der in vielen Fällen 0,5 beträgt oder größer ist. Der Kanal-Korrelationskoeffizient R_c, wie er durch die Kanalkorrellations-Koeffizientenberechnungsschaltung 203a ermittelt wird, wird als Signal 220c zu einer Kanal-Mischverhältnis-Einstellschaltung 203c übertragen.
  • Die Kanal-Mischverhältnis-Einstellschaltung 203c stellt das Kanal-Mischverhältnis R_m aus dem Kanal-Korrelationskoeffizienten R_c ein.
  • 25 zeigt ein Ablaufdiagramm für die Kanal-Mischverhältnis-Einstellschaltung 203c, um das Kanal-Mischungsverhältnis R_m einzustellen.
  • In 25 wird ein Absolutwert |R_c| des Kanal-Korrelationskoeffizienten R_c, der von der Kanalkorrelations-Koeffizientenberechnungsschaltung 203a geliefert wird, zuerst beim Schritt S301 ermittelt. Sodann wird beim Schritt S302 geprüft, ob |R_c| < 0,5 ist oder nicht. Falls |R_c| < 0,5 ist, geht die Verarbeitung weiter zum Schritt S303, und ansonsten geht die Verarbeitung weiter zum Schritt S305, bei dem R_m = 0,0 festgelegt wird.
  • Andererseits wird beim Schritt S303 geprüft, ob |R_c| < 0,3 ist oder nicht. Falls |R_c| < 0,3 ist, geht die Verarbeitung weiter zum Schritt S304, und ansonsten geht die Verarbeitung weiter zum Schritt S306, bei dem R_m = 0,125 festgelegt wird.
  • Beim Schritt S304 wird geprüft, ob |R_c| < 0,1 ist oder nicht. Falls |R_c| < 0,1 ist, geht die Verarbeitung weiter zum Schritt S308, um R_m = 0,5 festzulegen. Ansonsten geht die Übertragung weiter zum Schritt S307, bei dem R_m = 0,25 festgelegt wird.
  • Obwohl der Referenzwert für einen Vergleich mit dem Absolutwert |R_c| und das Kanal-Mischungsverhältnis R_m in dem Ablaufdiagramm gemäß 25 frei festgelegt werden können, ist es erwünscht, den Wert von R_m so auszuwählen, dass er größer wird, je kleiner der Wert von |R_c| ist, und den Wert R_m so auszuwählen, dass er in einem Bereich von 0,0 bis 0,5 liegt.
  • Der Wert des Kanal-Mischungsverhältnisses R_m kann aus einer folgenden mathematischen Gleichung berechnet werden: R_m = 10(–3/20 × (10 × |R_c|+1)).
  • Zurückkehrend zur 24 sei angemerkt, dass das Kanal-Mischungsverhältnis R_m, wie es durch die Kanal-Mischungsverhältnis-Einstellschaltung 203c ermittelt wird, als Signal 220d zu der Kanal-Mischschaltung 203b übertragen wird. Diese Kanal-Mischschaltung 203b mischt die Eingangssignale 220a, 220b auf der Grundlage des Kanal-Mischungsverhältnisses R_m, um aus der Mischung resultierende Signale 220e, 220f abzugeben. Die aus der Mischung resultierenden Ausgangssignale 220e, 220f werden zu einer Kanalumsetzschaltung 203d hin übertragen.
  • 26 zeigt einen veranschaulichenden Aufbau der in 24 gezeigten Kanal-Mischschaltung 203b.
  • In 26 entsprechen die Signale 230a, 230b den L- bzw. R-Eingangssignalen der L- bzw. R-Kanäle gemäß 24. Das L-Kanal-Signal 230a wird an Multiplizierer 204a, 204b abgegeben, während das R-Kanal-Signal 230b an Multiplizierer 204c, 204d abgegeben wird.
  • Die Multiplizierer 204a, 204d multiplizieren das ihnen zugeführte Signal mit 1/(1+R_m), um das multiplizierte Signal abzugeben, während die Multiplizierer 204b, 204c das ihnen zugeführte Signal mit R_m/(1+R_m) multiplizieren, um das multiplizierte Signal abzugeben. R_m ist der Wert des oben erwähnten Kanal-Mischungsverhältnisses. Die Ausgangssignale der Multi plizierer 204a, 204b, 204c und 204d werden als Signale 230c, 230d, 230e bzw. 230f abgegeben.
  • Die Signale 230c und 230e von den Multiplizierern 204a, 204c werden mittels eines Addierers 204e summiert, während die Signale 230d, 230f von den Multiplizierern 204b, 204d mittels des Addierers 204f zusammen summiert werden. Ein Ausgangssignal 230g des Addierers 204e entspricht dem Ausgangssignal 220e von der Kanal-Mischschaltung 203b, während ein Ausgangssignal 230h des Addierers 204f dem Ausgangssignal 220f der Kanalmischschaltung 203b entspricht.
  • Werden die Ausgangssignale 230g, 230h der Kanalmischschaltung 203b, welche die L- und R-Kanal-Eingangssignale 230a, 230b enthalten, als L'- bzw. R'-Kanäle bezeichnet, so werden die folgenden Berechnungen: L' = (L + R_m·R)/(1 + R_m) R' = (R + R_m·L)/(1 + R_m)im dargestellten Falle der Kanalmischschaltung 203b ausgeführt.
  • Zurückkehrend zur 24 sei bemerkt, dass die Kanal-Umsetzschaltung 203d eine Kanalumsetzungsverarbeitung ausführt, die im wesentlichen jener Verarbeitung entspricht, welche durch die Kanal-Umsetzschaltung 119a von 19 ausgeführt wird. Dies heißt, dass die Kanal-Umsetzschaltung 203d das L'-Kanal-Signal 220e und das R'-Kanal-Signal 220f von der Kanalmischschaltung 203b in ein (L'+R')/2 entsprechendes Signal 220g bzw. in eine (L'-R')/2 entsprechendes Signal 220h umsetzt. Das (L'+R')/2 entsprechende Signal 220g und das (L'-R')/2 entsprechende Signal 220h werden zu der ersten Codierungsschaltung 202b bzw. zu der zweiten Codierungsschaltung 202c gemäß 23 übertragen.
  • Obwohl bei der Ausführungsform gemäß 24 gesonderte bzw. getrennte Verarbeitungsoperationen in der Kanalmischschaltung 203b und in der Kanal-Umsetzschaltung 203d getrennt ausgeführt werden, können diese Verarbeitungsoperationen gemeinsam zu einer Zeit ausgeführt werden. Dies heißt, dass die Kanalmischschaltung 203b und die Kanal-Umsetzschaltung 203d zu einem Einheitsaufbau zusammengebaut sein können.
  • 27 zeigt einen veranschaulichenden Aufbau, bei dem als weiterem veranschaulichenden Aufbau der adaptiven Kanal-Umsetzschaltung 202a von 23 die Kanalmischschaltung 203b und die Kanal-Umsetzschaltung 203d als eine bzw. zu einer Kanalmischungs-Umsetzschaltung 205b zusammengebaut sind. In 27 kennzeichnen die Eingangssignale 240a, 240b die Eingangssignale 220a bzw. 220b von 24, während eine Kanalkorrelations-Koeffizientenberechnungsschaltung 205a und die Kanal-Mischungsverhältnis-Einstellschaltung 205c die Kanal-Korrelationskoeffizienten-Berechnungsschaltung 203a bzw. die Kanal-Mischungsverhältnis-Einstellschaltung 203c von 24 kennzeichnen. Die Signale 240c, 240d sind den Signalen 220c bzw. 220d von 24 gleichzusetzen. Daher werden diese Signale oder Schaltungen nicht speziell erläutert.
  • 28 zeigt einen veranschaulichenden Aufbau der Kanalmischungs-Umsetzungsschaltung 205b von 27.
  • In 28 entsprechen die Signale 250a, 250b den L- bzw. R-Kanal-Eingangssignalen 240a bzw. 240b von 27.
  • Das L-Kanal-Signal 250a und das R-Kanal-Signal 250b werden einem Addierer 206a zugeführt, um zusammensummiert zu werden. Ein Ausgangssignal 250c des Addierers 206a gelangt zu einem Multiplizierer 206c, wodurch es mit 1/2 multipliziert und als Signal 250e abgegeben wird.
  • Auf der anderen Seite gelangen das L-Kanal-Signal 250a und das R-Kanal-Signal 250b zu einer Subtrahiereinrichtung 206b zur Subtraktion. Das resultierende Differenzsignal wird als Signal 250d zu einem Multiplizierer 206d übertragen, der sodann das Signal 250d mit (1-R_m)/(1+R_m)/2 multipliziert, um das resultierende Signal als Signal 250f abzugeben.
  • Werden die Ausgangssignale 250e, 250f der Kanalmischschaltung 205b, welche die L- und R-Kanal-Eingangssignale 250a bzw. 250b enthalten, als A- bzw. B-Kanäle bezeichnet, so werden die folgenden Berechnungen A = (L + R)/2 B = (L – R)(1 – R_m)/(1 + R_m)/2bei der vorliegenden Ausführungsform der Kanalmischungs-Umsetzungsschaltung 205b ausgeführt.
  • Die durch die oben beschriebene Codierungsvorrichtung von 23 erzeugte Codefolge kann unter Heranziehung der in 21 dargestellten Decodierungsvorrichtung decodiert werden.
  • 29 zeigt Eingangssignale der L- und R-Kanäle sowie Ausgangssignale der L' und R'-Kanäle in der Kanalmischschaltung 203b von 24.
  • Falls die Stereosignale der L- und R-Kanäle, welche die in 29A dargestellten Frequenzspektralkomponenten aufweisen, das sind Signale mit einer niedrigen Interkanal-Korrelation, in die Kanalmischschaltung 203b gemäß 24 als Eingangssignale 220a, 220b eingegeben werden, werden die Signale 220e, 220f der L'- und R'-Kanäle, welche die in 29B gezeigten Frequenzsignalkomponenten aufweisen, von der Kanalmischschaltung 203b als Ergebnis der oben beschriebenen Mischung in der Kanalmischschaltung 203b abgegeben.
  • 30 zeigt das auf eine Codierung und auf eine anschließende Decodierung der Signale 220e, 220f der L'- und R'-Kanäle, wie sie in 29B gezeigt sind, hin erzeugte Quantisierungsrauschen. Genauer gesagt zeigen 30A und 30B Frequenzsignalkomponenten der L'-Kanal-Signale von 29B bzw. jene der R'-Kanal-Signale von 29B. 30C und 30D zeigen Frequenzsignalkomponenten von Signalen, die durch Umsetzung der L'- und R'-Kanäle in die (L'+R')/2- bzw. (L'-R')/2-Kanäle erhalten werden. Die (L'+R')/2- und (L'-R')/2-Kanäle werden als A- bzw. B-Kanäle bezeichnet.
  • 30E und 30F zeigen das Quantisierungsrauschen, welches auf eine Codierung der Signale der A- und B-Kanäle durch das oben beschriebene hocheffiziente Codierungsverfahren und das anschließende Decodieren der codierten A- und B-Kanal-Signale erzeugt wird. In der Zeichnung sind mit N1 und N2 die Frequenzspektrum-Signalverläufe der Quantisierungsrauschkomponenten bezeichnet, die auf eine Codierung der A- und B-Kanal-Signale hin erzeugt werden.
  • Es sei darauf hingewiesen, dass das auf eine Codierung und Decodierung des A-Kanals erhaltene Signal und das auf eine Codierung und Decodierung des B-Kanals erhaltene Signal mit (A+N1) bzw. (B+N2) bezeichnet werden bzw. sind.
  • 30G und 30H zeigen den Zustand, in welchem die jeweiligen Kanäle der Stereosignale von den Signalformen bzw. -verläufen von (A+N1) und (B+N2) abgetrennt worden sind. Genauer gesagt werden die Frequenzsignalkomponenten des R'-Kanals durch Addition von (A+N1) und (B+N2) ausgelöscht, um lediglich die Frequenzsignalkomponenten des L'-Kanals zurückzubekommen. In entsprechender Weise werden die Frequenzsignalkomponenten des L'-Kanals durch Subtraktion von (B+N1) von (A+N2) ausgelöscht, um lediglich die Frequenzsignalkomponenten des R'-Kanals wiederzuerlangen.
  • Zusammenfassend stellen 30G und 30H den Zustand des Quantisierungsrauschens in dem Fall dar, dass die Signale von 29A durch das Verfahren gemäß der vorliegenden Erfindung verarbeitet worden sind.
  • Es sei darauf hingewiesen, dass die Signale von 29A den in 2A und 2B gezeigten Signalen entsprechen. Dabei ist ersichtlich, dass dann, wenn das Verfahren gemäß dem Stand der Technik angewandt wird, das Quantisierungsrauschen, welches auf eine Codierung hin, der eine Decodierung folgt, erzeugt wird, so ist, wie dies in 2G und 2H gezeigt ist. Aus einem Vergleich der 30G und 30H mit den 2G und 2H kann somit ersehen werden, dass das Verfahren gemäß der vorliegenden Erfindung an der Auswirkung des Quantisierungsrauschens in einem geringeren Ausmaß leidet als das bekannte Verfahren.
  • Da bei der vorliegenden Erfindung die L- und R-Kanal-Signale der Stereotonsignale in L'- und R'-Kanäle umgesetzt werden, wie dies in 29 veranschaulicht ist, ist das Maß der Interkanaltrennung herabgesetzt, und als Ergebnis davon ist das sogenannte sich verbreitende bzw. diffuse Hörempfinden, welches für die Stereosignale beim Probehören der wiedergegebenen Signale geeignet ist, leicht herabgesetzt. Diese Herabsetzung in dem sich verbreitenden bzw. diffusen Empfinden ist jedoch vernachlässigbar im Vergleich zur Wirkung des Quantisierungsrauschens.
  • Die vorliegende Erfindung ist somit auf das Codierungsverfahren gerichtet, welches eine Wiedergabe einer kleinen Anzahl von Kanälen mittels der dem alten Standard genügenden Wiedergabevorrichtung und eine große Anzahl von Kanälen mit der dem neuen Standard genügenden Wiedergabevorrichtung ermöglicht und welches eine Kanalmischung auf der Grundlage einer Interkanal-Korrelation ausführt, um die Tonqualitätsverschlechterung zu minimieren. Die vorliegende Erfindung ist außerdem auf einen Aufzeichnungsträger gerichtet, auf dem so erhaltene codierte Signale aufgezeichnet sind.
  • Ein derartiges Codierungsverfahren ist soweit beschrieben worden, bei dem mit Hilfe des ersten Codierungsverfahrens die gesamten Signale in zwei Bänder aufgeteilt werden und bei dem die resultierenden Bandsignale orthogonal transformiert werden, um Spektralkoeffizienten zu erzeugen. Diese Spektralkoeffizienten werden dann normiert und quantisiert, um durch eine feste Längencodierung codiert zu werden. Mittels des zweiten Codierungsverfahrens werden die gesamten Signale in zwei Bänder aufgeteilt, und die resultierenden Bandsignale werden orthogonal transformiert, um Spektralkoeffizienten zu erzeugen. Diese Spektralkoeffizienten werden dann in Tonkomponenten und in andere Komponenten aufgeteilt, wobei die betreffenden Komponenten gesondert normiert und quantisiert werden, um durch eine variable Längencodierung codiert zu werden. Dieses Codierungsverfahren ist lediglich veranschaulichend, so dass verschiedene andere Verfahren in Betracht gezogen werden können. So kann das erste Codierungsverfahren beispielsweise ein solches Codierungsverfahren sein, bei dem Zeitbereichssignale, die auf eine Bandaufteilung und auf eine Dezimierung in Abhängigkeit von Bandbreiten erhalten werden, normiert und quantisiert werden, um durch eine feste Längencodierung codiert zu werden, während das zweite Codierungsverfahren ein solches Codierungsverfahren sein kann, bei dem die Zeitbereichssignale des gesamten Frequenzspektrums orthogonal transformiert werden und bei dem die resultierenden Spektralkoeffizienten für eine Codierung normiert und quantisiert werden. Als zweites Codierungsverfahren wird vorzugsweise ein solches Verfahren bzw. eine solche Technik angewandt, das bzw. die zu optimalem Codierungswirkungsgrad führt, um die Herabsetzung in der Tonqualität auf die Wiedergabe durch die dem alten Standard genügende Wiedergabevorrichtung auf ein Minimum zu minimieren.
  • Obwohl die vorstehende Beschreibung im Hinblick auf den Fall einer Aufzeichnung eines codierten Bitstroms auf einem Aufzeichnungsträger erfolgt ist, kann die vorliegende Erfindung auch auf die Übertragung des Bitstroms über eine Übertragungsleitung, wie über ein Netzwerk angewandt werden. Als Aufzeichnungsträger kann nicht nur ein Aufzeichnungsträger, wie eine optische Disk, sondern auch ein anderes Aufzeichnungsmedium, wie ein Halbleiterspeicher verwendet werden, falls das verwendete Aufzeichnungsmedium einen wahlfreiem bzw. beliebigen Zugriff gestattet.

Claims (30)

  1. Codierungsverfahren, umfassend: Erzeugen (202a; S302...S308) von Mischkoeffizienten (R_m) aus einer Vielzahl von Kanalsignalen (L, R), wobei die betreffenden Mischkoeffizienten (R_m) aus Interkanal-Korrelationskoeffizienten (R_c) festgelegt werden; Mischen (204a...204f; 206a...206d) der betreffenden Kanalsignale (L, R) auf der Grundlage der genannten Mischkoeffizienten (R_m); Erzeugen (203d; 205b) einer Vielzahl von Verarbeitungssignalen (A, B) entsprechend den genannten Kanalsignalen (L, R) aus den gemischten Kanalsignalen (L', R'); und Codieren (202b, 202c) der betreffenden Verarbeitungssignale (A, B).
  2. Codierungsverfahren nach Anspruch 1, wobei die genannten Mischkoeffizienten (R_m) auf Werte festgelegt (203c) werden, die die Interkanal-Korrelationskoeffizienten (R_c) nach einem Kanalmischen größer machen als jene vor dem Kanalmischen.
  3. Codierungsverfahren nach Anspruch 1 oder 2, wobei die genannten Interkanal-Korrelationskoeffizienten (R_c) aus der Kovarianz und Standardabweichung der Kanalsignale (L, R) ermittelt werden.
  4. Codierungsverfahren nach einem der Ansprüche 1 bis 3, wobei die genannten Mischkoeffizienten (R_m) auf Werte festgelegt werden, die kleiner werden, je größer die Interkanal-Korrelationskoeffizienten (R_c) sind.
  5. Codierungsverfahren nach einem der Ansprüche 1 bis 4, wobei die genannten Mischkoeffizienten (R_m) auf Werte festgelegt werden (S302...S308), die größer werden, je kleiner die Interkanal-Korrelationskoeffizienten (R_c) sind.
  6. Codierungsverfahren nach einem der Ansprüche 1 bis 5, wobei die genannten Mischkoeffizienten (R_m) eine Vielzahl von Koeffizienten umfassen, derart, dass die Summe der Koeffizienten für eine Multiplikation der jeweiligen Kanäle (L, R) gleich 1 ist.
  7. Codierungsverfahren nach einem der Ansprüche 1 bis 6, wobei die Codierung (202b, 202c) eine erste Codierungsverarbeitung (202b) für einen Teil der genannten Verarbeitungssignale (A) und eine zweite Codierungsverarbeitung (202c) für den restlichen Teil der Verarbeitungssignale (B) umfasst.
  8. Codierungsverfahren nach Anspruch 7, wobei die genannte zweite Codierungsverarbeitung (202c) Zeitbereichs-Verarbeitungssignale in Spektralsignale in Form eines Transformationsblockes mit einer zuvor festgelegten Länge transformiert (111a) und die resultierenden, in Blöcken vorliegenden Spektralsignale codiert (111b).
  9. Codierungsverfahren nach Anspruch 8, wobei die genannte erste Codierungsverarbeitung (202b) die Zeitbereichs-Verarbeitungssignale jedes Transformationsblockes einer zuvor festgelegten Länge in Spektralsignale transformiert (111a) und die resultierenden Spektralsignale codiert (111b) und wobei die Transformations-Blocklänge bei Transformation der Zeitbereichs-Verarbeitungssignale bei der betreffenden zweiten Codierung in die Spektralsignale länger ist als die Transformations-Blocklänge in dem Fall, dass die Verarbeitungssignale in Spektralsignale transformiert werden.
  10. Codierungsverfahren nach einem der Ansprüche 7 bis 9, wobei die genannte zweite Codierungsverarbeitung (202c) Spek tralsignale eines Transformationsblockes über eine Vielzahl von Rahmen codiert.
  11. Codierungsverfahren nach einem der Ansprüche 7 bis 10, wobei die genannte zweite Codierungsverarbeitung (202c) Signalkomponenten der Verarbeitungssignale durch eine variable Längencodierung codiert.
  12. Codierungsverfahren nach einem der Ansprüche 7 bis 11, wobei die genannte zweite Codierungsverarbeitung die Verarbeitungssignale in tonale Komponenten und andere Komponenten aufteilt zur Codierung der aufgeteilten Komponenten.
  13. Codierungsverfahren nach einem der Ansprüche 7 bis 12, wobei die genannte erste Codierungsverarbeitung (202b) und die zweite Codierungsverarbeitung (202c) sich in zugeteilten Bitraten zur Zeit der Codierung unterscheiden.
  14. Codierungsverfahren nach einem der Ansprüche 1 bis 13, wobei die genannten Kanalsignale (L, R) Audiosignale sind.
  15. Codierungsverfahren, umfassend: Erzeugen (202a; S302...S308) von Mischkoeffizienten (R_m) aus einer Vielzahl von Kanalsignalen (L, R), wobei die betreffenden Mischkoeffizienten (R_m) aus Interkanal-Korrelationskoeffizienten (R_c) festgelegt werden; Erzeugen (203d; 205d) einer Vielzahl von Verarbeitungssignalen (A, B) entsprechend den genannten Kanalsignalen (L, R) aus den betreffenden Kanalsignalen (L, R); Multiplizieren (204a...204d, 206c...206d) der genannten Verarbeitungssignale (A, B) mit Koeffizienten, die aus den genannten Mischkoeffizienten (R_m) abgeleitet sind; und Codieren (202b, 202c) der mit den genannten Koeffizienten multiplizierten Verarbeitungssignale (A, B).
  16. Codierungsvorrichtung, umfassend: eine Einrichtung (202a; S302...S308) zum Erzeugen von Mischkoeffizienten (R_m) aus einer Vielzahl von Kanalsignalen (L, R), wobei die betreffenden Mischkoeffizienten (R_m) aus Interkanal-Korrelationskoeffizienten (R_c) festgelegt sind; eine Einrichtung (204a...204f; 206a...206d) zum Mischen der genannten Kanalsignale (L, R), auf der Grundlage der genannten Mischkoeffizienten (R_m); eine Einrichtung (203d; 205b) zum Erzeugen einer Vielzahl von Verarbeitungssignalen. (A, B) entsprechend den genannten Kanalsignalen (L, R) aus den gemischten Kanalsignalen (L', R'); und eine Einrichtung (202b, 20c) zum Codieren der betreffenden Verarbeitungssignale (A, B).
  17. Codierungsvorrichtung nach Anspruch 16, wobei die genannten Mischkoeffizienten (R_m) auf Werte festgelegt (203c) sind, welche die Interkanal-Korrelationskoeffizienten (R_c) nach einem Kanalmischen größer machen als jene vor dem Kanalmischen.
  18. Codierungsvorrichtung nach Anspruch 16 oder 17, wobei die genannten Interkanal-Korrelationskoeffizienten (R_c) aus der Kovarianz und Standardabweichung der Kanalsignale (L, R) ermittelt sind.
  19. Codierungsvorrichtung nach einem der Ansprüche 16 bis 18, wobei die genannten Mischkoeffizienten (R_m) auf Werte festgelegt sind, die kleiner werden, je größer die Interkanal-Korrelationskoeffizienten (R_c) sind.
  20. Codierungsvorrichtung nach einem der Ansprüche 16 bis 19, wobei die genannten Mischkoeffizienten (R_m) auf Werte festgelegt (S302...S308) sind, die größer werden, je kleiner die Interkanal-Korrelationskoeffizienten (R_c) sind.
  21. Codierungsvorrichtung nach einem der Ansprüche 16 bis 20, wobei die genannten Mischkoeffizienten (R_m) eine Vielzahl von Koeffizienten umfassen, derart, dass die Summe der Koeffi zienten zur Multiplikation der jeweiligen Kanäle (L, R) gleich 1 ist.
  22. Codierungsvorrichtung nach einem der Ansprüche 16 bis 21, wobei die Codierung (202b, 202c) eine erste Codierungsverarbeitung (202b) für einen Teil (A) der genannten Verarbeitungssignale und eine zweite Codierungsverarbeitung (202c) für den restlichen Teil (B) der Verarbeitungssignale umfasst.
  23. Codierungsvorrichtung nach Anspruch 22, wobei die genannte zweite Codierungsverarbeitung (202c) Zeitbereichs-Verarbeitungssignale in Spektralsignale in Form eines Transformationsblockes mit einer zuvor festgelegten Länge transformiert und die resultierenden, in Blöcken vorliegenden Spektralsignale codiert.
  24. Codierungsvorrichtung nach Anspruch 23, wobei die genannte erste Codierungsverarbeitung (202b) die Zeitbereichs-Verarbeitungssignale jedes Transformationsblockes von einer zuvor festgelegten Länge in Spektralsignale transformiert (111a) und die resultierenden Spektralsignale codiert (111b) und wobei die Transformations-Blocklänge in dem Fall, dass die Zeitbereichs-Verarbeitungssignale bei der zweiten Codierung in die Spektralsignale transformiert werden, länger ist als die Transformations-Blocklänge in dem Fall, dass die Verarbeitungssignale in Spektralsignale transformiert werden.
  25. Codierungsvorrichtung nach einem der Ansprüche 22 bis 24, wobei die genannte zweite Codierungsverarbeitung (202b) Spektralsignale eines Transformationsblockes über eine Vielzahl von Rahmen codiert.
  26. Codierungsvorrichtung nach einem der Ansprüche 22 bis 25, wobei die genannte zweite Codierungsverarbeitung (202c) Signalkomponenten der Verarbeitungssignale durch eine variable Längencodierung codiert.
  27. Codierungsvorrichtung nach einem der Ansprüche 22 bis 26, wobei die genannte zweite Codierungsverarbeitung die Verarbeitungssignale in tonale Komponenten und andere Komponenten aufteilt zur Codierung der aufgeteilten Komponenten.
  28. Codierungsvorrichtung nach einem der Ansprüche 22 bis 27, wobei die genannte erste Codierungsverarbeitung (202b) und die zweite Codierungsverarbeitung (202c) sich in zugeteilten Bitraten zur Zeit der Codierung unterscheiden.
  29. Codierungsvorrichtung nach einem der Ansprüche 16 bis 28, wobei die genannten Kanalsignale (L, R) Audiosignale sind.
  30. Codierungsvorrichtung, umfassend: eine Einrichtung (202a; S302...S308) zur Erzeugung von Mischkoeffizienten (R_m) aus einer Vielzahl von Kanalsignalen (L, R), wobei die betreffenden Mischkoeffizienten (R_m) aus Interkanal-Korrelationskoeffizienten (R_c) festgelegt sind; eine Einrichtung (203d; 205d) zur Erzeugung einer Vielzahl von Verarbeitungssignalen (A, B) entsprechend den genannten Kanalsignalen (L, R) aus den betreffenden Kanalsignalen (L, R); eine Einrichtung (204a...204d, 206c...206d) zum Multiplizieren der genannten Verarbeitungssignale (A, B) mit aus den genannten Mischkoeffizienten (R_m) abgeleiteten Koeffizienten; und eine Einrichtung (202b, 202c) zum Codieren der mit den genannten Koeffizienten multiplizierten Verarbeitungssignale (A, B).
DE69829242T 1997-05-13 1998-05-11 Tonsignalkodierverfahren und -gerät Expired - Lifetime DE69829242T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP12244997 1997-05-13
JP12244997 1997-05-13

Publications (2)

Publication Number Publication Date
DE69829242D1 DE69829242D1 (de) 2005-04-14
DE69829242T2 true DE69829242T2 (de) 2006-02-09

Family

ID=14836129

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69829242T Expired - Lifetime DE69829242T2 (de) 1997-05-13 1998-05-11 Tonsignalkodierverfahren und -gerät

Country Status (4)

Country Link
US (1) US6356211B1 (de)
KR (1) KR19980086960A (de)
CN (1) CN1145894C (de)
DE (1) DE69829242T2 (de)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6529730B1 (en) * 1998-05-15 2003-03-04 Conexant Systems, Inc System and method for adaptive multi-rate (AMR) vocoder rate adaption
JP2000123486A (ja) * 1998-10-21 2000-04-28 Pioneer Electronic Corp 記録装置
JP4406988B2 (ja) * 1999-03-29 2010-02-03 ソニー株式会社 不揮発性記録媒体、記録方法、記録装置
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
DE19959156C2 (de) * 1999-12-08 2002-01-31 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals
US6614365B2 (en) * 2000-12-14 2003-09-02 Sony Corporation Coding device and method, decoding device and method, and recording medium
JP3598993B2 (ja) * 2001-05-18 2004-12-08 ソニー株式会社 符号化装置及び方法
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US7809241B2 (en) * 2002-03-01 2010-10-05 Thomson Licensing Audio frequency scaling during video trick modes utilizing digital signal processing
US7149412B2 (en) * 2002-03-01 2006-12-12 Thomson Licensing Trick mode audio playback
US6625387B1 (en) * 2002-03-01 2003-09-23 Thomson Licensing S.A. Gated silence removal during video trick modes
US7130528B2 (en) * 2002-03-01 2006-10-31 Thomson Licensing Audio data deletion and silencing during trick mode replay
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
DE602005022235D1 (de) * 2004-05-19 2010-08-19 Panasonic Corp Audiosignalkodierer und Audiosignaldekodierer
JP4555299B2 (ja) * 2004-09-28 2010-09-29 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
JP2006197391A (ja) * 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
EP1876586B1 (de) * 2005-04-28 2010-01-06 Panasonic Corporation Audiocodierungseinrichtung und audiocodierungsverfahren
EP1876585B1 (de) * 2005-04-28 2010-06-16 Panasonic Corporation Audiocodierungseinrichtung und audiocodierungsverfahren
US8150702B2 (en) * 2006-08-04 2012-04-03 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
US20100010811A1 (en) * 2006-08-04 2010-01-14 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
US20100121632A1 (en) * 2007-04-25 2010-05-13 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and their method
JPWO2009122757A1 (ja) * 2008-04-04 2011-07-28 パナソニック株式会社 ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
CN101604524B (zh) * 2008-06-11 2012-01-11 北京天籁传音数字技术有限公司 立体声编码方法及其装置、立体声解码方法及其装置
US20090319279A1 (en) * 2008-06-19 2009-12-24 Hongwei Kong Method and system for audio transmit loopback processing in an audio codec
JP5333257B2 (ja) * 2010-01-20 2013-11-06 富士通株式会社 符号化装置、符号化システムおよび符号化方法
CN103368682B (zh) 2012-03-29 2016-12-07 华为技术有限公司 信号编码和解码的方法和设备
EP2950308B1 (de) 2013-01-22 2020-02-19 Panasonic Corporation Generator für bandbreitenerweiterungsparameter, codierer, decodierer, verfahren zur generierung von bandbreitenerweiterungsparametern, codierverfahren und decodierungsverfahren

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61107818A (ja) * 1984-10-30 1986-05-26 Nec Corp エントロピ−符号化方式とその装置
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5414423A (en) * 1993-04-29 1995-05-09 International Business Machines Corporation Stabilization of probability estimates by conditioning on prior decisions of a given context
JP3175446B2 (ja) * 1993-11-29 2001-06-11 ソニー株式会社 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
US5635930A (en) * 1994-10-03 1997-06-03 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus and recording medium
JP2766466B2 (ja) * 1995-08-02 1998-06-18 株式会社東芝 オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法

Also Published As

Publication number Publication date
CN1145894C (zh) 2004-04-14
KR19980086960A (ko) 1998-12-05
US6356211B1 (en) 2002-03-12
DE69829242D1 (de) 2005-04-14
CN1199202A (zh) 1998-11-18

Similar Documents

Publication Publication Date Title
DE69829242T2 (de) Tonsignalkodierverfahren und -gerät
DE69837738T2 (de) Dekodierverfahren und -gerät
DE69434225T2 (de) Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger
DE69214523T3 (de) Dekodierer für variable anzahl von kanaldarstellungen mehrdimensionaler schallfelder
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE69534140T2 (de) Verfahren und vorrichtung zur signalkodierung und -dekodierung, aufzeichnungsmedium und signalübertragungsverfahren
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE69034231T2 (de) Digitales Übertragungssystem zur Übertragung von Skalenfaktoren
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
JP3804968B2 (ja) 適応配分式符号化・復号装置及び方法
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
DE69633633T2 (de) Mehrkanaliger prädiktiver subband-kodierer mit adaptiver, psychoakustischer bitzuweisung
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
DE60020663T2 (de) Verfahren zur Formatierung eines Audiodatenstroms
DE4225434A1 (de) Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
EP0878798B1 (de) Tonsignalkodierverfahren und -gerät
DE102005014477A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
DE4222623C2 (de) Verfahren zum Übertragen oder Speichern von digitalisierten Tonsignalen
EP0931386A1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE102004043521A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
DE69932861T2 (de) Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung
DE19705751B4 (de) Verfahren und Gerät zur Übertragung eines Signals
DE69835990T2 (de) Audio-Codierer/-decodierer hoher Qualität

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)