DE69434225T2 - Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger - Google Patents

Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger Download PDF

Info

Publication number
DE69434225T2
DE69434225T2 DE69434225T DE69434225T DE69434225T2 DE 69434225 T2 DE69434225 T2 DE 69434225T2 DE 69434225 T DE69434225 T DE 69434225T DE 69434225 T DE69434225 T DE 69434225T DE 69434225 T2 DE69434225 T2 DE 69434225T2
Authority
DE
Germany
Prior art keywords
frequency
dimensional blocks
compression parameters
information compression
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69434225T
Other languages
English (en)
Other versions
DE69434225D1 (de
Inventor
Osamu Shinagawa-ku Shimoyoshi
Kenzo Shinagawa-ku Akagiri
Hiroshi Shinagawa-ku Suzuki
Makoto Shinagawa-ku Mitsuno
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of DE69434225D1 publication Critical patent/DE69434225D1/de
Application granted granted Critical
Publication of DE69434225T2 publication Critical patent/DE69434225T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Signal Processing For Recording (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf Verfahren und eine Vorrichtung zum Aufzeichnen und/oder Wiedergeben und/oder Übertragen und/oder zum Empfangen von Daten, beispielsweise bit-komprimierter digitaler Audiosignale oder dgl., und einen dazugehörigen Aufzeichnungsträger. Insbesondere, jedoch nicht ausschließlich, bezieht sich die Erfindung auf eine Vorrichtung, ein Verfahren und auf einen Aufzeichnungsträger zum Aufzeichnen mit einem Kompressionsmodus von mehreren Bitraten.
  • Die US-A 5 243 588 und die US-A 5 244 705 (Sony) offenbaren ein Verfahren, welches in Einklang mit bit-komprimierten digitalen Eingangssignalen ist und bei dem die bit-komprimierten Signale burstartig mit einem vorher festgelegten Datenvolumen als Aufzeichnungseinheit aufgezeichnet werden.
  • Dieses Verfahren beruht auf der Anwendung einer magneto-optischen Platte als Aufzeichnungsträger und dem Aufzeichnen und/oder dem Wiedergeben von AD-PCM-Audiodaten (AD = adaptiv differentiell), wie bei den Audiodatenformaten vorgeschrieben, beispielsweise CD-I oder CD-ROM XA. Die AD-PCM-Audiodaten werden auf der magnetooptischen Platte burstartig aufgezeichnet, wobei beispielsweise 32 Sektoren der AD-PCM-Daten und wenige Verknüpfungssektoren zur Verschachtelung eine Aufzeichnungseinheit bilden.
  • Bei dem Aufzeichnungs- und/oder Wiedergabegerät, bei dem die magneto-optische Platte verwendet wird, können mehrere Modi der AD-PCM-Audiodaten ausgewählt werden. Beispielsweise sind eine Ebene A mit einer Kompressionsrate, die zweimal größer ist als bei der herkömmlichen Compact-Disc (CD) und eine Abtastfrequenz von 37,8 kHz hat, eine Ebene B mit einer Kompressionsrate, die viermal so groß ist wie die bei der herkömmlichen Compact-Disc (CD) und eine Abtastrate von 37,8 kHz aufweist, und eine Ebene C mit einer Kompressionsrate, die achtmal so groß ist wie die bei der herkömmlichen Compact-Disc (CD) und eine Abtastrate von 18,9 kHz aufweist, vorgeschrieben. Das heißt, bei der oben erläuterten Ebene B werden die digitalen Audiodaten auf ungefähr ein Viertel des Ursprungsvolumens komprimiert, wobei die Wiedergabezeit der Platte, welche mit dem Levelmodus B bespielt wurde, das Vierfache von der beim Standard-CD-Format ist. Dies zeigt, dass die Vorrichtung bezüglich der Baugröße reduziert werden kann, da eine Aufzeichnungs-/Wiedergabezeit ungefähr solang wie die, die mit einer Platte von 12 cm Durchmesser der Standardgröße erreicht werden kann, mit einer Platte kleinerer Größe erreicht werden kann.
  • Da jedoch die Drehgeschwindigkeit der Platte die gleiche ist wie die bei einer Standard-CD, beträgt die Menge der komprimierten Daten, welche mit dem Ebene B pro vorher eingestellter Zeit erreicht wird, das Vierfache von der der Standard-CD. Folglich werden die gleichen komprimierten Daten in einer Zeiteinheit von beispielsweise einem Sektor oder einem Cluster wiederholt viermal gelesen, und lediglich ein Datenwort der vier überlagerten komprimierten Daten wird zur Audioreproduktion übertragen. Insbesondere wird während des Abtastens oder des Spurnachführens einer spiralförmigen aufgezeichneten Spur ein Spursprung, um zur Startspurposition zurückzukehren, für jede Umdrehung durchgeführt, um wiederholt die gleiche Spiralspur viermal aufzuspüren. Dies führt dazu, dass zumindest ein Datenwort der vier Abtastungen komprimierter Tondaten von wiederholten Leseoperationen genügt. Daher ist das offenbarte Verfahren gegenüber Fehlern, welche durch Störungen verursacht werden, effektiv, und kann insbesondere zur Verwendung in Verbindung mit einer portablen Einrichtung kleiner Baugröße verwendet werden.
  • Da ein Halbleiterspeicher in der Zukunft als Aufzeichnungsträger verwendet werden wird, wünscht man sich, eine weitere Kompression zu erreichen, um die Kompressionswirksamkeit zu verbessern. Insbesondere werden Audiosignale aufgezeichnet und/oder reproduziert, wobei eine sogenannte IC-Karte verwendet wird (welche einen oder mehrere solche Halbleiterspeicher enthält) auf oder von welcher bit-komprimierte Daten entsprechend aufgezeichnet oder reproduziert werden.
  • Mit der IC-Karte werden Steigerungen der Speicherkapazität oder niedrigere Herstellungskosten über den Fortschritt der Halbleitertechnologie erreicht. Trotz dieses Fortschritts wurde, wenn die IC-Karte zuerst auf den Markt gebracht wurde, geglaubt, dass die IC-Karte eine nichtadäquate Speicherkapazität hat und außerdem teuer war. Daher wurde in Betracht gezogen, den Aufzeichnungsinhalt eines preiswerten großen Aufzeichnungsträgers beispielsweise der magneto-optischen Platte zur IC-Karte wiederholt zu übertragen, wobei Daten mehrere Male umgeschrieben wurden. Insbesondere wurde eine gewünschte Anzahl von Musikstücken, welche auf der magneto-optischen Platte aufgezeichnet waren, auf die IC-Karte kopiert und mit anderen Musikstücken ausgetauscht (oder überschrieben), welche schon auf der IC-Karte gespeichert waren. Durch häufiges Umschreiben des Inhalts der IC-Karte auf diese Weise kann man sich an einer großen Vielfalt von Musikstücken außerhalb des Hauses mit einer kleinen Anzahl von IC-Karten, die man bei sich trägt, erfreuen.
  • Zum Aufzeichnen/Reproduzieren von Audiosignalen sind jedoch die Frequenzbandbreiten und das Signal-Rausch-Verhältnis für eine Vielzahl von Anwendungen verschieden. Wenn beispielsweise eine hohe Qualität von Audiosignalen gewünscht wird, sind die Bandbreite von 15 kHz bis 20 kHz und ein gutes Signal-Rausch-Verhältnis erforderlich. Für diese Zwecke wird eine höhere Bitrate toleriert. Die Bitrate in diesem Fall beträgt üblicherweise 256 kbps bis 64 kbps pro Kanal.
  • Wenn umgekehrt größtenteils Audiosignale gehandhabt werden, genügt eine Bandbreite von 5 bis 7 kHz, wobei ein signifikant hohes Signal-Rausch-Verhältnis nicht erforderlich ist. Um jedoch die Aufzeichnungs-/Wiedergabezeit für eine bestimmte Speichergröße zu vergrößern, wird gewünscht, die Bitrate von 64 kbps auf mehrere kbps zu vermindern. Im Hinblick darauf ist es notwendig, ein Aufzeichnungs-/Wiedergabegerät bereitzustellen, welches in der Lage ist, die mehreren Verwendungen, die unterschiedliche Befehlslevel haben, einzurichten, und bei dem man in der Lage ist, die wirtschaftliche Belastung bis zum maximalmöglichen Wert zu reduzieren. Wenn jedoch mehrere Modi, die unterschiedliche Bandbreiten haben, vorgesehen werden müssen, ist es daher notwendig, mehrere Abtastfrequenzen zu unterstützen, mit dem Ergebnis, dass die Abtastfrequenz-Signalerzeugungsschaltung dazu neigt, komplex zu werden, oder der LSI-Maßstab dazu tendiert, unvermeidlich ansteigen zu müssen. Wenn außerdem die Abtastfrequenz von einem Modus zum anderen verschieden ist, ist es schwierig, die Information von einem Modus zum anderen zu übertragen. Wenn gewünscht wird, Information im Hochbitratenmodus, die auf einer magneto-optischen Platte mit großer Speicherkapazität aufgezeichnet ist, auf eine kleine IC-Karte mit kleiner Kapazität in einem Niedrigbit-Ratenmodus zu schreiben, ist es notwendig, den Kompressionsmodus vollständig aufzuheben, um die Information in Bezug auf Zeitbereichssignale wiederherzustellen und die Signale in einem Niedrigratenmodus zu re-komprimieren, mit der Folge, dass die Menge an logischen Rechenschritten ansteigt, wodurch die Schwierigkeit einer Realzeitverarbeitung vergrößert wird.
  • Bei den Modi, die ansteigend niedrige Bitraten aufweisen, wird jedoch die Tonqualität aufgrund der Verminderung der Anzahl nutzbarer Bits abgesenkt. Wenn die Bandbreite eingeengt wird, wenn die Bandbreite der Frequenzunterteilung zur Kompression über den gesamten Frequenzbereich konstant ist, ist die Bandbreite, welche aus der Unterteilung für den gesamten Frequenzbereich von 20 kHz in 32 Bändern gleicher Breiten resultiert, gleich 700 Hz, was signifikant breiter ist als das kritische Niedrigbereichs-Band von 100 Hz und breiter ist als die kritischen Bänder für den Hauptbereich des Frequenzbereichs. Dies hat eine wesentlich abgesenkte Kompressionswirksamkeit zur Folge. Wenn jedoch die Bitrate abgesenkt wird, wenn die Bitreduzierung vorzugsweise für die Hauptinformation oder die Hilfsinformationen gemacht wird, wird die Tonqualität wesentlich abgesenkt. Aus diesem Grund wird es notwendig, nicht nur die Hauptinformation, sondern außerdem ebenfalls die Hilfsinformation zu reduzieren.
  • Sowohl die GB-A 2 257 606 als auch die GB-A 2 258 372 beschreiben Systeme, bei denen bit-komprimierte Daten, welche mit einer konstanten Bitrate auf einer magnetooptischen Platte aufgezeichnet sind, zu einer Überschuss-Bit-Beseitigungsschaltung übertragen werden. Diese Schaltung entfernt zumindest einige der bit-komprimierten Daten, so dass es keinen Unterschied in Bezug auf das Quantisierungsrauschen gibt, welches durch das menschliche Ohr wahrgenommen wird. Somit kann die Menge an Daten, welche auf einem anderen Träger, beispielsweise einer IC-Karte aufgezeichnet werden, reduziert werden. Gemäß diesem System kann ein Hochgeschwindigkeitskopieren erreicht werden, da die Daten in komprimiertem Zustand übertragen werden. Die Daten, welche durch Bitentfernung bit-komprimiert wurden, besitzen eine variable Bitrate.
  • Verschiedene andere Merkmale der Erfindung sind in den entsprechenden unterschiedlichen unabhängigen Patentansprüchen dieser Anmeldung offenbart.
  • Bevorzugte Ausführungsformen der Erfindung, die anschließend ausführlich beschrieben werden, liefern: digitale Signalverarbeitungsverfahren und eine Vorrichtung, bei der eine Abtastfrequenz-Signalerzeugungsschaltung unkompliziert ist und der LSI-Maßstab nicht als Ergebnis der Bereitstellung der mehreren Bitratenmodi vergrößert werden muss; eine Aufzeichnungs-/Wiedergabevorrichtung für komprimierte Daten, bei der bit-komprimierte Daten von einem Aufzeichnungsträger, beispielsweise einer magneto-optischen Platte oder einer optischen Platte, mit einer Aufzeichnungsmenge logischer Rechenoperationen kopiert werden können, oder wo die bit-komprimierten Daten von einem anderen Aufzeichnungsträger, beispielsweise einer IC-Karte mit einer reduzierten Menge an logischen Rechenoperationen reproduziert werden können; und ein Aufzeichnungs-/Wiedergabegerät für komprimierte Daten, bei dem es möglich ist, das Volumen von Hilfsinformation auf einen notwenigen Minimalwert zu unterdrücken und um durch die Verschlechterung der Tonqualität aufgrund der niedrigen Bitrate abzusenken.
  • Bei dem bevorzugten Aufzeichnungs- und/oder Wiedergabegerät für komprimierte Daten und dem Verfahren und dem Aufzeichnungsträger wird die gleiche Abtastfrequenz verwendet, ungeachtet des Unterschieds bezüglich der Bitrate für die entsprechenden Modi, um einen Anstieg an Hardware zu vermeiden, der aus dieser Komplexität resultiert.
  • Die Übertragung der Information, die schwierig zu erreichen war, wenn unterschiedliche Abtastfrequenzen für die jeweiligen Modi verwendet werden, kann einfach erzielt werden. Wenn beispielsweise gewünscht wird, die Information im Hochbit-Ratenmodus von einer magneto-optischen Platte großer Kapazität auf eine IC-Karte kleiner Kapazität mit einem niedrigen Bitratenmodus zu schreiben, muss die Niedrigbitratenkompression lediglich durch eine zusätzliche Verarbeitungsoperation realisiert werden, ohne die Notwendigkeit, den Kompressionsmodus zum Umkehren bezüglich Signalen in den Zeitbereich zu annullieren, so dass das Volumen der Verarbeitungsoperationen minimiert werden kann, während jedoch eine Realzeit-Verarbeitungsoperation erreicht wird. Das Schalten vom Niedrigbit-Ratenmodus in den Bitratenmodus mit einer Bitrate, welche höher ist als die niedrige Bitrate, kann lediglich durch Formatumsetzung erreicht werden, d. h., durch Umanordnen der codierten Informationsdaten.
  • Gemäß einem bevorzugten Merkmal der Erfindung kann die Umsetzung zwischen unterschiedlichen Bitratenmodi mit hoher Geschwindigkeit ohne Umsteuerung in die Zeitbereichssignale durchgeführt werden, wobei die gleiche Orthogonal-Transformations-Blockgröße für entsprechende Bitratenmodi verwendet wird. Zusätzlich können mehrere Blöcke zum Blockgleiten und/oder Quantisierungs-Rausch-Beeinträchtigungsblöcke, die längs der Zeitskala oder Frequenzskala einander benachbart sind, allgemein verwendet werden, um das Volumen der subsidiären Information zu vermindern, wie diese für die Blöcke zum Blockgleiten und/oder die Quantisierungs-Rausch-Beeinträchtigungsblöcke erforderlich ist, beispielsweise den Maßstabsfaktor oder die Wortlängendaten. Da akustische Signale hohe Korrelation sowohl längs der Zeitskala als auch der der Frequenzskala zeigen, gibt es wenig Einwirkung (im Fall von akustischen Signalen) in Bezug auf die Tonqualität, wenn die Blöcke zum Blockgleiten und/oder die Quantisierungs-Rausch-Beeinträchtigungsblöcke allgemein verwendet werden. Wenn die Signale vorübergehend nicht-stationär sind, ist es möglich, eine variable Orthogonal-Transformations-Blockgröße zu verwenden, um zu verhindern, dass die Kompressionswirksamkeit abgesenkt wird. Die Bits für die subsidiäre Information, die somit gelöscht sind, können der Hauptinformation zugeteilt werden. Zusätzlich kann durch Ändern der Gruppe der subsidiären Information, welche allgemein in Abhängigkeit von der Orthogonal-Transformations-Blockgröße verwendet wird, die Orthogonal-Transformations-Blockgröße geändert werden, so dass die subsidiäre Information allgemein in einer optimalen Weise verwendet werden kann, sogar, obwohl die Struktur der Blöcke für das Blockgleiten oder der Blöcke, die durch das Quantisierungsrauschen beeinträchtigt werden, geändert wird.
  • Wenn dagegen im Fall von Audiosignalen, wobei die Frequenzbandbreite für die Quantisierungsrauschsteuerung die gleiche ist für alle Modi unabhängig von den Frequenzen, die Frequenzrate von 20 kHz in 32 Bändern unterteilt wird, liegt die Frequenzbandbreite im Bereich von 700 Hz, was signifikant breiter ist als die kritische Bandbreite von 100 Hz für den unteren Frequenzbereich. Damit wird die Frequenzbreite enger als die Bandbreite des kritischen Bandes für den mittleren bis unteren Bereich, womit somit die Quantisierungs- und Codierwirksamkeit signifikant abgesenkt werden. Vorzugsweise wird die Frequenzbandbreite für die Quantisierungsrauschsteuerung so ausgewählt, dass sie in Richtung auf die höheren Frequenzen für zumindest die Mehrzahl der Frequenzbänder breiter wird, was aus der Unterteilung resultiert, so dass die Frequenzbandbreite für die Quantisierungsrauschsteuerung enger an der kritischen Bandbreite sein wird.
  • Wenn die bit-komprimierten Daten vom Aufzeichnungsträger, beispielsweise der magneto-optischen Platte, auf einen anderen Aufzeichnungsträger, beispielsweise eine IC-Karte kopiert werden, können die Daten oder nach einer zusätzlichen Kompression unmittelbar kopiert werden, ohne eine Vollbit-Expansion durchzuführen. Wenn die zusätzliche Kompression durchgeführt werden soll, können die Umanordnung und die Um-Quatisierung von Datenbits im Frequenzbereich ohne Signaltransformation durchgeführt werden, wobei die Datenbits gemeinsam mit den mehreren subsidiären Daten aufgezeichnet werden.
  • Bei dem Aufzeichnungs- und/oder Wiedergabegerät für komprimierte Daten und dem Verfahren und dem Aufzeichnungsträger kann die gleiche Abtastfrequenz verwendet werden, um zu verhindern, dass die Abtastfrequenz-Erzeugungsschaltung kompliziert wird, und außerdem um zu verhindern, dass der Hardware-Aufwand vergrößert wird. Die Übertragung der Information zwischen Modi mit unterschiedlichen Raten kann leicht ohne die Notwendigkeit komplizierter Operationen, beispielsweise einer Abtastraten-Umsetzung erreicht werden. Wenn man wünscht, die Hochbit-Ratenmodusinformation, welche auf einer magnetooptischen Platte großer Kapazität aufgezeichnet ist, auf eine IC-Karte kleiner Kapazität mit einer niedrigen Bitrate zu schreiben, kann die Niedrigbitraten-Moduskompression durch eine zusätzliche Verarbeitungsoperation realisiert werden, um den Anstieg des Volumens von Rechenoperationen zu minimieren, wobei die Operation auch auf Realzeitbasis erreicht werden kann. Zusätzlich kann vermieden werden, dass die Tonqualität für den Niedrigbit-Ratenmodus abgesenkt wird.
  • Die Erfindung wird nun weiter mittels eines beispielhaften und nichteinschränkenden Beispiels mit Hilfe der beiliegenden Zeichnungen beschrieben, in denen:
  • 1 ein Blockschaltungsdiagramm ist, welches ein Aufzeichnungs- und/oder Wiedergabegerät für komprimierte Daten nach der Erfindung zeigt;
  • 2 den Aufzeichnungsinhalt einer magneto-optischen Platte und einer IC-Karte zeigt;
  • 3 eine schematische Vorderansicht eines Beispiels der Vorrichtung, welche in 1 gezeigt ist, ist;
  • 4 ein Blockschaltungsdiagramm ist, welches eine Ausführungsform einer Codiervorrichtung zeigt, um ein hochwirksames Codierverfahren für Audiodaten durchzuführen, welches bei der in 1 gezeigten Ausführungsform verwendet wird;
  • 5 eine Diagrammansicht ist, um eine Blockgröße für Orthogonal-Transformation für die in 1 gezeigte Ausführungsform zu zeigen;
  • 6 ein Blockschaltungsdiagramm ist, welches einen Aufbau zeigt, um Bitzuteilung und eine logische Rechenfunktion durchzuführen;
  • 7 das Spektrum kritischer Bänder und Bänder zeigt, die unterteilt sind, um das Blockgleiten in betracht zu ziehen;
  • 8 eine grafische Darstellung ist, welche Relativebenen eines Maskierungsspektrums in Bezug auf Spektralkomponenten innerhalb eines Signalspektrums zeigt;
  • 9 eine grafische Darstellung ist, welche eine Minimalhörbarkeitskurve und das Maskierungsspektrum, die miteinander kombiniert sind, zeigt;
  • 10 ein Blockschaltungsdiagramm ist, welches eine konkrete Anordnung zum Durchführen eines zweiten Bitzuteilungsverfahrens zeigt;
  • 11a und 11b grafische Darstellungen sind, welche die Bitzuteilung und das Rauschspektrum für ein Flattersignalspektrum bei dem zweiten Bitzuteilungsverfahren zeigen;
  • 12a und 12b grafische Darstellungen sind, welche die Bitzuordnung und das Rauschspektrum für ein Signalspektrum zeigen, welches Hochsignal-Spektraltonalität bei dem zweiten Bitzuteilungsverfahren zeigt;
  • 13 eine grafische Darstellung ist, welche die Beziehung zwischen der Frequenz und der Zeit für einen Verarbeitungsblock von 11,6 ms für einen A-Modus zeigt, wobei der Frequenzbereich in 52 Bändern unterteilt ist, einschließlich kritischer Bänder und Bänder, um das Blockgleiten in betracht zu ziehen, wobei die Blockgröße für die Orthogonal-Transformation ein Lang-Modus ist;
  • 14 eine grafische Darstellung ist, welche die Beziehung zwischen Frequenz und Zeit für eine Verarbeitungsblock von 11,8 ms für den A-Modus zeigt, wobei der Frequenzbereich in 52 Bänder unterteilt ist, einschließlich kritischer Bänder und Bänder, um das Blockgleiten in betracht zu ziehen, wobei die Blockgröße für die Orthogonal-Transformation ein Kurz-Modus ist;
  • 15 eine grafische Darstellung ist, welche die Beziehung zwischen Frequenz und Zeit für einen Verarbeitungsblock von 23,2 ms für den B-Modus zeigt, wobei der Frequenzbereich in 52 Bänder unterteilt ist, einschließlich kritischer Bänder und Bänder, um das Blockgleiten in betracht zu ziehen, wobei die Blockgröße für die Orthogonal-Transformation ein Lang-Modus ist;
  • 16 eine grafische Darstellung ist, welche die Beziehung zwischen Frequenz und Zeit für einen Verarbeitungsblock von 23,2 ms für den B-Modus zeigt, wobei der Frequenzbereich in 11 Bänder für einen Verarbeitungsblock von 23,2 ms für den B-Modus unterteilt ist, einschließlich kritischer Bänder und Bänder, um das Blockgleiten in betracht zu ziehen, wobei die Blockgröße für die Orthogonal-Transformation ein Kurz-Modus ist;
  • 17 eine grafische Darstellung ist, welche die Beziehung zwischen Frequenz und Zeit für einen Verarbeitungsblock von 23,2 ms für den B-Modus zeigt, einschließlich kritischer Bänder und Bänder, um das Blockgleiten in betracht zu ziehen, wobei die Blockgröße für die Orthogonal-Transformation sowohl ein Kurz-Modus als auch ein Lang-Modus ist;
  • 18 ein Blockdiagramm ist, welches eine Ausführungsform einer adaptiven Bitzuordnungs- und Codierschaltung für den B-Modus zeigt;
  • 19 ein Blockschaltungsdiagramm ist, welches eine spezielle Anordnung zur Hochgeschwindigkeits-Umsetzung vom A-Modus in den B-Modus zeigt; und
  • 20 ein Blockschaltungsdiagramm ist, welches ein spezielles Beispiel einer Decodiervorrichtung zeigt, um ein Hocheffizienz-Codierverfahren für Audiodaten nach der Erfindung durchzuführen.
  • Beispielhafte Ausführungsformen der Erfindung werden nun ausführlich mit Hilfe der Zeichnungen beschrieben.
  • 1 zeigt eine schematische Anordnung (Blockschaltungsdiagramm) einer Aufzeichnungs- und/oder Wiedergabevorrichtung für komprimierte Daten gemäß einer Ausführungsform der Erfindung.
  • Die in 1 gezeigte Aufzeichnungs-/Wiedergabevorrichtung weist eine Aufzeichnungs-/Wiedergabeeinheit für eine magneto-optische Platte 1 als Aufzeichnungsträger und eine Aufzeichnungseinheit für eine IC-Karte 2 als weiteren Aufzeichnungsträger auf, mit zwei Einheiten, welche in einem System angeordnet sind. Wenn Signale, welche von der magneto-optischen Platte 1 durch den Wiedergabebereich der Aufzeichnungs-/Wiedergabeeinheit für die magneto-optische Platte auf der IC-Karte 2 aufgezeichnet werden (durch den Aufzeichnungsbereich der Aufzeichnungs-/Wiedergabeeinheit für die IC-Karte 2), werden reproduzierte komprimierte Daten durch einen optischen Kopf 53 von der magnetooptischen Platte 1 der Wiedergabeseite gelesen und zu einem Decoder 71 für eine EFM-Demodulation (Acht-auf-Vierzehn-Modulation) geliefert. Der Decoder 71 liefert eine Entschachtelung und eine Fehlerkorrektur, d. h., ATC-Audiodaten, welche zu einem Speicher 85 der IC-Kartenaufzeichnungseinheit geliefert werden. Die ATC-Audiodaten werden durch Hinzufügen eines variablen Bitraten-Codierfensters durch einen Zusatzkompressor 24 verarbeitet. Der Zusatzkompressor 84 führt eine Zusatzoperation einer Entropie-Codierung für den Speicher 85 durch. Die ATC-Audiodaten werden dann über eine IC-Kartenschnittstellenschaltung 86 auf der IC-Karte 2 aufgezeichnet. Auf diese Weise werden die reproduzierten komprimierten Daten zum Aufzeichnungssystem zum Aufzeichnen auf der IC-Karte 2 in einem komprimierten Zustand vor einer Expansion durch einen ATC-Decoder 73 übertragen.
  • Für die übliche Audioreproduktion werden komprimierte Daten vom Aufzeichnungsträger (magneto-optische Platte 1) intermittierend oder burstartig mit einer vorher festgelegten Datenmenge beispielsweise 32 + mehreren Sektoren als Einheit gelesen und zur Umsetzung in fortlaufende Audiosignale expandiert. Während des Kopierens werden komprimierte Daten auf dem Aufzeichnungsträger fortlaufend gelesen und zum Aufzeichnungssystem zum Aufzeichnen übertragen. Auf diese Weise kann eine Hochgeschwindigkeits- oder Kurzzeit-Kopierung in Abhängigkeit vom Datenkompressionsverhältnis durchgeführt werden.
  • Die in 1 gezeigte Anordnung wird nun weiter ausführlich erläutert. In der magneto-optischen Plattenaufzeichnungs-/Wiedergabeeinheit der Aufzeichnungs- und/oder Wiedergabevorrichtung für komprimierte Daten, welche in 1 gezeigt ist, wird die magneto-optische Platte 1, die durch einen Spindelmotor 51 gedreht wird, als Aufzeichnungsträger verwendet. Um Daten auf der magneto-optischen Platte 1 aufzuzeichnen, wird ein moduliertes Magnetfeld entsprechend den Aufzeichnungsdaten durch einen Magnetkopf 54 angelegt, während die magneto-optische Platte 1 mit einem Laserlichtstrahl durch den optischen Kopf 53 bestrahlt wird. Beim Wiedergeben der aufgezeichneten Daten wird eine Auf zeichnungspur auf der magneto-optischen Platte 1 durch einen Laserlichtstrahl zwecks foto-magnetischer Reproduktion aufgespürt.
  • Die folgende Beschreibung richtet sich hauptsächlich auf die Aufzeichnungs-/Wiedergabevorrichtung. Der optische Kopf 53 besteht aus einer Laserlichtquelle, beispielsweise einer Laserdiode, optischen Komponenten, beispielsweise einer Kollimatorlinse, einer Objektivlinse, einem Polarisationslicht-Strahlenteiler oder einer Zylinderlinse, und einem Fotodetektor, der einen Lichtempfangsabschnitt, der ein vorher festgelegtes Muster aufweist, aufweist. Der optische Kopf 53 ist an einer Position angeordnet, welche dem Magnetkopf 54 zugewandt ist, wobei die magneto-optische Platte 1 dazwischen angeordnet ist. Um Daten auf der magneto-optischen Platte 1 aufzuzeichnen, wird der Magnetkopf 54 durch eine Kopfansteuerschaltung 66 eines Aufzeichnungssystems angesteuert, wie hier später erläutert wird, um ein moduliertes Magnetfeld entsprechend den Aufzeichnungsdaten an die Platte 1 anzulegen, wobei ein Laserlichtstrahl durch den optischen Kopf 53 auf eine Zielspur der magnetooptischen Platte gestrahlt wird, um diese gemäß einer Magnetfeldmodulation thermo-magnetisch zu beschreiben. Zusätzlich ermittelt der Magnetkopf 53 ein reflektiertes Laserlicht von der Zielspur, um einen Fokussierungsfehler durch ein Astigmatik-Verfahren zu ermitteln und um einen Spurnachführungsfehler durch ein Gegentaktverfahren zu bestimmen. Wenn Daten von der magneto-optischen Platte 1 reproduziert werden, ermittelt der optische Kopf 53 zusätzlich zur Ermittlung des Fokussierungsfehlers und/oder des Spurnachführungsfehlers auch die Differenz des Polarisationswinkels (des Kerr-Drehwinkels) des reflektierten Lichts von der Zielspur, um Wiedergabesignale zu erzeugen.
  • Ein Ausgangssignal des optischen Kopfes 53 wird zu einer RF-Schaltung 55 geliefert, welche die oben erläuterten Fokussierungsfehlersignale und die Spurnachführungsfehlersignale vom Ausgangssignal extrahiert. Diese extrahierten Signale werden zu einer Servosteuerschaltung 56 geliefert. Die RF-Schaltung 55 setzt außerdem die Wiedergabesignale in Zwei-Pegel-Signale um, die zu einem Decoder 71 des Wiedergabesystems geliefert werden, wie hier später erläutert wird.
  • Die Servosteuerschaltung 56 besteht beispielsweise aus einer Fokussierungsservo-Steuerschaltung, einer Spurnachführungsservo-Steuerschaltung, einer Spindelservo-Steuerschaltung, einer Getriebeservo-Steuerschaltung usw.. Die Fokussierungsservo-Steuerschaltung steuert das optische System des optischen Kopfes 53 durch Fokussierung, so dass das Fokussierungssignal auf null reduziert wird. Die Spurnachführungsservo-Steuerschaltung steuert das optische System des optischen Kopfes 53 so, dass das Spurnachführungssignal auf null reduziert wird. Die Spindelmotor-Servosteuerschaltung steuert den Spindelmotor 51, um die magneto-optische Platte 1 zwecks Drehung mit einer vorher festgelegten Drehgeschwindigkeit laufen zu lassen, beispielsweise mit einer konstanten Lineargeschwindigkeit. Die Getriebeservo-Steuerschaltung verschiebt den optischen Kopf 53 und den Magnetkopf 54 auf eine Zielspurposition der magneto-optischen Platte 1, wie durch eine Systemsteuerung 57 bestimmt wird. Die Servosteuerschaltung 56 überträgt Information, welche die Betriebszustände der verschiedenen Komponenten zeigt, welche durch die Servosteuerschaltung 56 gesteuert werden, zur Systemsteuerung 57.
  • Eine Tasteneingabeeinheit 58 und eine Anzeigeeinrichtung 59 sind mit der Systemsteuerung 57 verbunden, welche das Aufzeichnungssystem und das Wiedergabesystem steuert, unter einem Betriebsmodus, wie durch die Eingabeinformation bestimmt wird, die in der Tasteneingabeeinheit 58 eingegeben wird. Die Systemsteuerung 57 überwacht außerdem die Aufzeichnungsposition und die Wiedergabeposition auf der Aufzeichnungsspur, welche durch den optischen Kopf 53 und den Magnetkopf 54 nachgeführt wird, auf der Basis der Sektorbasis-Adressinformation von Q-Daten, beispielsweise der Kopfzeit oder der Subcodedaten, welche auf der magneto-optischen Platte 1 aufgezeichnet sind. Zusätzlich bewirkt die Systemsteuerung 57, dass der Bitkompressionsmodus auf der Anzeigeeinrichtung 59 angezeigt wird, auf der Basis der Bitkompressions-Modusinformation in einem Codierer 63, wie durch die Tasteingabeeinheit 58 ausgewählt wurde (wie später erläutert wird) und der Kompressionsmodusinformation in den Wiedergabedaten, wie über ein Wiedergabesystem (später erläutert) von der RF-Schaltung 55 erzielt wird, während veranlasst wird, dass die Wiedergabezeit auf der Anzeigeeinrichtung 59 auf der Basis des Datenkompressionsverhältnisses im Bitkompressionsmodus und der Wiedergabepositionsinformation auf der Aufzeichnungsspur angezeigt wird.
  • Für die Wiedergabezeitanzeige wird die Sektorbasis-Adressinformation (absolute Zeitinformation), welche von der Kopfzeit oder dem Subcode-Q-Daten von der Aufzeichnungsspur der magneto-optischen Platte 1 reproduziert wird, mit einem reziproken Wert des Datenkompressionsverhältnisses für den Bitkompressionsmodus multipliziert, beispielsweise 4 für das Bitkompressionsverhältnis von ¼, um die aktuelle Zeitinformation festzulegen, welche auf der Anzeigeeinrichtung 9 angezeigt wird. Während des Aufzeichnens, wenn die Absolutzeitinformation auf der Aufzeichnungsspur der magneto-optischen Platte 1 vorher aufgezeichnet ist, d. h., wenn die magneto-optische Platte 1 vorher formatiert wurde, ist es möglich, die aktuelle Aufzeichnungszeit anzuzeigen, wobei die vorher formatierte Absolutzeitinformation gelesen wird und diese mit einem Reziprokwert des Datenkompressionsverhältnisses multipliziert wird.
  • Bei einem Aufzeichnungssystem der vorliegenden Plattenaufzeichnungs-/Wiedergabevorrichtung werden analoge Audioeingangssignale AIN von einem Eingangsanschluss 60 über ein Tiefpassfilter 61 zu einem A/D-Umsetzer 62 geliefert, der die analogen Audioeingangssignale AIN quantisiert. Die digitalen Audioeingangssignale vom A/D-Umsetzer 62 werden zu einem adaptiven Transformationscodier-PCM (ATC)-Codierer 63 geliefert. Alternativ werden digitale Audioeingangssignale DIN von einem Eingangsanschluss 67 über eine digitale Eingangsschnittstellenschaltung 68 zum ATC-Codierer 63 geliefert. Der ATC-Codierer 63 führt eine Bitkompression (Datenkompression) gemäß den verschiedenen Modi des ATC-Systems durch, wie in Tabelle 1 gezeigt ist. Diese Bitkompression wird in Bezug auf die digitalen Audio-PCM-Daten (welche das oben erläuterte Eingangssignal-AIN sind, welches durch den A/D-Umsetzer 62 quantisiert wurde) mit einer vorher festgelegten Übertragungsrate quantisiert, welche das oben erwähnte Eingangssignal AIN sind, welches durch den A/D-Umsetzer 62 quantisiert wurde. Der Betriebsmodus des ATC-Codierers 63 wird durch die Systemsteuerung 57 festgelegt. Für den B-Modus sind die Daten beispielsweise die komprimierten Daten, welche die Abtastfrequenz von 44,1 kHz und die Bitrate von 64 kbps (ATC-Daten) haben, und sie werden zu einem Speicher 64 geliefert. Die Datenübertragungsrate für den Stereomodus B ist auf 1/8 der Übertragungsrate für das CD-DA-Standard-Format von 75 Sektoren pro Sekunde oder 9,375 Sektoren pro Sekunde reduziert.
  • Tabelle 1 Abtastfrequenz = 44,1 kHz
    Figure 00120001
  • Bei der Ausführungsform von 1 sei angenommen, dass die Abtastfrequenz des A/D-Umsetzers 62 bei der Abtastfrequenz des CD-DA-Standard-Formats (44,1 kHz) fest ist, und dass die Abtastfrequenz im ATC-Codierer 63 beibehalten wird, um eine Bitkompression durchzuführen. Da gilt, dass umso niedriger die Bitrate des Modus ist, desto enger das Signaldurchlassband wird, wird daher die Grenzfrequenz des Tiefpassfilters 61 in einer entspre chenden Weise eingestellt. Das heißt, es genügt, die Grenzfrequenz des Tiefpassfilters 61 des A/D-Umsetzers 62 in Abhängigkeit vom Kompressionsmodus zu steuern.
  • Der Speicher 64 ist ein Pufferspeicher, dessen Datenschreiben und Datenlesen durch die Systemsteuerung 57 gesteuert wird. Der Speicher 64 speichert vorübergehend die ATC-Daten, welche vom ATC-Codierer 63 geliefert werden, um diese auf der Platte aufzuzeichnen, wenn die Notwendigkeit auftritt. Das heißt, dass für den Stereomodus B die komprimierten Audiodaten, welche vom ATC-Codierer 63 geliefert werden, eine Datenübertragungsrate haben, die auf 1/8 der Datenübertragungsrate für das CD-DA-Standard-Format von 75 Sektoren pro Sekunde oder 9,375 Sektoren pro Sekunde vermindert wurde. Die komprimierten Daten werden fortlaufend in den Speicher 64 geschrieben. Obwohl es ausreicht, die komprimierten Daten (ATC-Daten) mit einer Rate von 1/8 Sektoren aufzuzeichnen, wie oben erläutert wurde, ist dieses Aufzeichnen alle 8 Sektoren praktisch unmöglich, so dass sektorstetiges Aufzeichnen, wie später erläutert wird, durchgeführt wird. Dieses Aufzeichnen wird burstartig mit der Datenübertragungsrate von 75 Sektoren pro Sekunde durchgeführt, welche die gleiche ist wie beim CD-DA-Standard-Format, mit einem Cluster, der beispielsweise aus vorher festgelegten mehreren Sektoren besteht, beispielsweise 32 + mehreren Sektoren als Aufzeichnungseinheit mit der Zwischenposition einer Nichtaufzeichnungsperiode. Das heißt, dass im Speicher 64 die Stereo-Modus-B-ATC-Audiodaten, welche mit einer niedrigen Übertragungsrate von 9,375 (= 75/8) Sektoren pro Sekunde fortlaufend geschrieben wurden, in Verbindung mit dem Bitkompressionsmodus als Aufzeichnungsdaten burstartig mit der oben erläuterten Übertragungsrate von 75 Sektoren pro Sekunde gelesen werden. Die gesamte Datenübertragungsrate der Daten, die gelesen werden und die aufgezeichnet werden, einschließlich der Nichtaufzeichnungsperiode ist die niedrige Rate von 9,375 Sektoren pro Sekunde. Die gegenwärtige Datenübertragungsrate innerhalb der Zeitperiode des Aufzeichnungsbetriebs, der burstartig durchgeführt wird, ist die oben erwähnte Standard-Daten-Übertragungsrate von 75 Sektoren pro Sekunde. Wenn daher die Plattendrehgeschwindigkeit die gleiche ist wie beim CD-DA-Standard-Format, d. h., die konstante Lineargeschwindigkeit, wird das Aufzeichnen mit der gleichen Aufzeichnungsdichte und mit dem gleichen Aufzeichnungsmuster wie beim CD-DA-Format durchgeführt.
  • Die ATC-Audiodaten, die aufzuzeichnen sind, werden aus dem Speicher 64 mit der oben erwähnten stetigen Übertragungsrate von 75 Sektoren pro Sekunde gelesen und zu einem Codierer 65 geliefert. Die Aufzeichnungseinheit, mit der die Datenfolge, welche vom Speicher 64 zum Codierer 65 geliefert wird, ist ein Cluster, der aus mehreren Sektoren besteht, beispielsweise 32 Sektoren, und mehreren Cluster-Verknüpfungs-Sektoren, die vorher und hinter dem Cluster aufgereiht sind. Die Cluster-Verknüpfungs-Sektoren werden so ausgewählt, dass sie länger sind als eine Verschachtelungslänge im Codierer 65, so dass Daten von benachbarten Clustern nicht durch Datenverschachtelung beeinträchtigt werden.
  • Der Codierer 65 führt eine Codierung zur Fehlerkorrektur durch, beispielsweise eine Paritäts-Anhängung und Datenverschachtelung oder EFM-Codierung in bezug auf die Aufzeichnungsdaten, welche vom Speicher 64 burstartig geliefert werden. Die Aufzeichnungsdaten, welche durch den Codierer 65 codiert wurden, werden dann zu einer Magnetkopf-Ansteuerschaltung 66 geliefert. Der Magnetkopf 54 ist mit der Magnetkopf-Ansteuerschaltung 66 verbunden und wird durch diese angesteuert, um ein moduliertes Magnetfeld entsprechend den Aufzeichnungsdaten an die magneto-optische Platte 1 anzulegen.
  • Die Systemsteuerung 57 steuert zusätzlich zum Steuern des Speichers 64 wie oben beschrieben außerdem die Aufzeichnungsposition in einer Weise, dass die Aufzeichnungsdaten, die burstartig vom Speicher 64 gelesen werden, fortlaufend auf der Aufzeichnungsspur der magneto-optischen Platte 1 aufgezeichnet werden. Die Aufzeichnungsposition wird durch Überwachung der Aufzeichnungsposition der Aufzeichnungsdaten, die burstartig durch die Systemsteuerung 57 vom Speicher 64 gelesen werden, und durch Liefern eines Steuersignals, welches die Aufzeichnungsposition auf der Aufzeichnungsspur der magneto-optischen Platte 1 bestimmt, zur Servosteuerschaltung 56 gesteuert.
  • Das Wiedergabesystem der Aufzeichnungs-/Wiedergabeeinheit für die magnetooptische Platte 1 wird anschließend erläutert. Das Wiedergabesystem wird dazu verwendet, die aufgezeichneten Daten, die fortlaufend auf der Aufzeichnungsspur der magneto-optischen Platte 1 aufgezeichnet sind, zu reproduzieren. Das Wiedergabesystem weist einen Decoder 71 auf, der einen Wiedergabeausgangsanschluss aufweist. Das Wiedergabeausgangssignal wird durch Nachführen der Aufzeichnungsspur der magneto-optischen Platte 1 mit einem Laserlichtstrahl von dem optischen Kopf 53 erzeugt. Der reflektierte Laserlichtstrahl wird durch den optischen Kopf 53 abgetastet und in Zwei-Pegel-Daten durch die RF-Schaltung 55 umgesetzt. Die aufgezeichneten Daten können nicht nur von der magneto-optischen Platte 1, sondern auch von der optischen Nur-Lese-Platte (gleiche Wiedergabeplatte wie die sogenannte Compact Disc) gelesen werden.
  • Der Decoder 71 ist ein Gegenstück zum Codierer 65 des oben beschriebenen Aufzeichnungssystems und führt die oben erläuterte Decodierung zur Fehlerkorrektur oder EFM-Decodierung in bezug auf das Zwei-Pegel-Wiedergabeausgangssignal der RF-Schaltung 55 durch. Der Decoder 71 reproduziert außerdem die AFC-Audiodaten des B-Modus mit einer Übertragungsrate von 75 Sektoren pro Sekunde, was schneller ist als die normale Übertra gungsrate für den Stereo-Modus B. Die durch den Decoder 71 erhaltenen Wiedergabedaten werden zu einem Speicher 72 geliefert.
  • Das Datenschreiben- und Lesen, welches durch die Systemsteuerung 57 gesteuert wird, wird im Speicher 72 in einer Weise durchgeführt, dass die Wiedergabedaten, welche vom Decoder 71 mit der Übertragungsrate von 75 Sektoren pro Sekunde geliefert werden, burstartig mit der Übertragungsrate von 75 Sektoren pro Sekunde geschrieben werden. Diese Wiedergabedaten, welche burstartig mit der Übertragungsrate von 75 Sektoren pro Sekunde in den Speicher 72 geschrieben werden, werden fortlaufend aus dem Speicher 72 mit der normalen Übertragungsrate für den Stereo-Modus B von 9,375 Sektoren pro Sekunde gelesen.
  • Die Systemsteuerung 57 steuert den Speicher 72 in einer Weise, um die Wiedergabedaten in den Speicher 72 mit der Übertragungsrate von 75 Sektoren pro Sekunde zu schreiben und um fortlaufend die Wiedergabedaten aus dem Speicher 72 mit der oben erwähnten Übertragungsrate von 9,375 Sektoren pro Sekunde zu lesen. Die Systemsteuerung 57 steuert, während sie den Speicher 72 wie oben beschrieben steuert, die Wiedergabeposition, so dass die Wiedergabedaten, welche burstartig in den Speicher 72 unter der Steuerung der Systemsteuerung 57 geschrieben werden, fortlaufend von der Aufzeichnungsspur der magneto-optischen Platte 1 reproduziert werden. Die Wiedergabeposition wird so gesteuert, dass die Wiedergabeposition für die Wiedergabedaten durch die Systemsteuerung 57 überwacht wird und das Steuerungssignal, welches die Wiedergabeposition auf der Aufzeichnungsspur der magneto-optischen Platte 1 oder der optischen Platte bestimmt, zur Servosteuerschaltung 56 übertragen wird.
  • Die ATC-Audiodaten des Stereo-Modus B, die als Wiedergabedaten erhalten werden, die fortlaufend aus dem Speicher 72 mit der Übertragungsrate von 9,375 Sektoren pro Sekunde gelesen werden, werden zu einem ATC-Decoder 73 geliefert. Der ATC-Decoder 73 ist ein Gegenstück zum ATC-Codierer 63 des Aufzeichnungssystems. Der Betriebsmodus des ATC-Decoders 73 wird durch die Systemsteuerung 57 derart bestimmt, dass die ATC-Daten des Stereo-Modus B beispielsweise um einen Faktor acht über Bitexpansion erweitert werden, um 16-Bit-Digitalaudiodaten zu reproduzieren. Die digitalen Audiodaten vom ATC-Decoder 73 werden zu einem D/A-Umsetzer 74 geliefert.
  • Der D/A-Umsetzer 74 übersetzt die digitalen Audiodaten, die vom ATC-Decoder 73 geliefert werden, in Analogsignale, um analoge Audioausgangssignale AOUT zu bilden. Die analogen Audioausgangssignale AOUT werden über ein Tiefpassfilter 75 an einem Ausgangsanschluss 76 ausgegeben.
  • Die oben erwähnte IC-Kartenaufzeichnungseinheit der Aufzeichnungs- und/oder Wiedergabevorrichtung für komprimierte Daten wird anschließend erläutert. Die analogen Audioeingangssignale AIN von einem Eingangsanschluss 60 werden über ein Tiefpassfilter 61 zur Quantisierung zu einem A/D-Umsetzer 62 geliefert. Die digitalen Audiosignale vom A/D-Umsetzer 62 werden zu einem Zusatzkompressor 84 geliefert, der eine Art von variablem Bitratencodierer ist, der eine sogenannte Entropie-Codierung durchführt. Damit wird die Entropie-Codierung durch die Zusatzkompressionseinheit 84 durchgeführt, wenn Daten in den Speicher 85 geschrieben oder daraus gelesen werden. Die Daten von der Zusatzkompressionseinheit 84, welche mit der variablen Bitrate zur Entropie-Codierung komprimiert und codiert wurden, werden über eine IC-Kartenschnittstellenschaltung 86 auf der IC-Karte 2 aufgezeichnet. Es ist natürlich bei der vorliegenden Erfindung möglich, eine konstante niedrige Bitratenaufzeichnung durchzuführen, indem die Blockgröße der Orthogonal-Transformation vergrößert oder die Frequenzbreite des Frequenzbereichsblocks zum Blockgleiten vergrößert wird, der eine Hilfsinformation aufweist, die die Quantisierung betrifft und/oder einen Block, der durch das Quantisierungsrauschen beeinträchtigt wird, anstelle eine variable Bitratenkompression, beispielsweise die Entropie-Codierung durchzuführen.
  • Die komprimierten Daten (ATC-Daten) vom Decoder 71 des Wiedergabesystems der Aufzeichnungs-/Wiedergabeeinheit für die magneto-optische Platte 1 werden ohne Expansion in der Zwischenzeit, d. h., unmittelbar zum Speicher 85 der IC-Kartenaufzeichnungseinheit 4 übertragen. Dieser Datentransfer wird unter der Steuerung des Speichers 85 durch die Systemsteuerung 57 während des sogenannten Hochgeschwindigkeitskopierens durchgeführt. Es ist außerdem möglich, die komprimierten Daten vom Speicher 72 zum Speicher 85 zu übertragen. Das Schreiben von der magneto-optischen Platte 1 oder der optischen Platte auf die IC-Karte durch Ändern des Bitratenmodus und durch Absenken der Bitrate ist für eine Aufzeichnung auf der IC-Karte geeignet, die hohe Herstellungskosten pro Aufzeichnungskapazitätseinheit hat. Dies ist wünschenswert, da dies nicht mit einer Frequenzumsetzung begleitet ist, bei der die Abtastfrequenz nicht die gleiche sein muss unabhängig von dem vorhandenen Bitratenmodus. Die tatsächliche Zusatzkompression wird in der Zusatzkompressionseinheit 84 durchgeführt.
  • Die sogenannte Hochgeschwindigkeits-Digitalkopieroperation wird nun erläutert. Während des digitalen Hochgeschwindigkeitskopierens wird eine Kopiertaste der Tasteneingabeeinheit 58 betätigt, um ein vorher festgelegtes Hochgeschwindigkeitskopieren unter Instruktionen auszuführen, welche von der Systemsteuerung 57 ausgegeben werden. Insbesondere werden komprimierte Daten vom Decoder 71 untermittelbar zum Speicher 85 des IC- Kartenaufzeichnungssystems übertragen und dann mit einer variablen Bitratencodierung durch die Zusatzkompressionseinheit 84 verarbeitet. Die codierten Daten werden dann über die IC-Kartenschnittstellenschaltung 86 auf der IC-Karte 2 aufgezeichnet. Wenn die ATC-Audiodaten für den Stereo-Modus B auf der magneto-optischen Platte 1 aufgezeichnet werden, werden die Daten, die um einen Faktor acht komprimiert wurden, fortlaufend vom Decoder 71 gelesen.
  • Folglich werden während des Hochgeschwindigkeitskopierens die komprimierten Daten, die einer Dauer entsprechen, die achtmal solang ist wie die Dauerzustandszeit auf der Realzeitbasis für den Stereo-Modus B entsprechen, fortlaufend von der magneto-optischen Platte 1 produziert. Diese komprimierten Daten werden entropie-codiert oder mit einer niedrigen konstanten Bitrate zum Aufzeichnen auf der IC-Karte codiert, so dass die hohe Kopiergeschwindigkeit, die achtmal so hoch wie die Dauerzustands-Kopiergeschwindigkeit, erreicht wird. Der Multiplikationsfaktor beim Hochgeschwindigkeitskopieren unterscheidet sich bei unterschiedlichen Kompressionsmodi. Das Hochgeschwindigkeitskopieren mit einer Rate, die höher ist als der Multiplikationsfaktor, der zur Kompression verwendet wird, kann ebenfalls durchgeführt werden, wobei in diesem Fall die magneto-optische Platte 1 mit einer Geschwindigkeit drehbar angetrieben wird, die ein Vielfaches schneller ist als die Dauerzustands-Geschwindigkeit.
  • Es sei angemerkt, dass nicht nur die Daten, welche mit einer konstanten Bitrate komprimiert und codiert wurden, auf der magneto-optischen Platte 1 aufgezeichnet sind, sondern auch die Information, welche das Datenvolumen im Zeitpunkt der variablen Ratenkompression und dem Codieren der Daten durch den Zusatzexpansionsblock 3 aufgezeichnet ist, wie in 2 gezeigt ist. Dadurch kann die Anzahl der Musiknummern, die auf der magnetooptischen Platte 1 aufgezeichnet sind oder die auf der IC-Karte 2 aufgezeichnet werden können, wie auch die Kombinationen der Musiknummern, die auf der IC-Karte 2 aufgezeichnet werden können, sofort durch Lesen der Datenvolumeninformation erkannt werden. Die Zusatzkompression von der festen Bitrate in Bezug auf den unteren Bitratenmodus kann im Zusatzkompander-Block 84 zusätzlich zur Entropie-Codierung in Bezug auf die variablen Bitratendaten durchgeführt werden.
  • Wenn umgekehrt die Information, welche das Datenvolumen im Zeitpunkt der Bitkompressionscodierung mit der konstanten Bitrate betrifft, wie auch die Daten, welche durch Bitkompression und Codierung mit der variablen Bitrate komprimiert sind, auf der IC-Karte 2 aufgezeichnet werden, kann das Datenvolumen im Zeitpunkt der Übertragung der Daten, beispielsweise Musiknummern von der IC-Karte 2 auf die magneto-optische Platte 1 schnell erkannt werden. Es ist natürlich möglich, die Daten, die mit einer festen Bitrate auf der IC-Karte 2 komprimiert und codiert wurden, zusätzlich zu den Daten, welche mit einer variablen Bitrate komprimiert und codiert wurden, aufzuzeichnen.
  • 3 zeigt in einer Vorderansicht die Aufzeichnungs-/Wiedergabevorrichtung 5 für die komprimierten Daten, die wie in 1 gezeigt angeordnet und aufgebaut ist. Die Vorrichtung 5 besitzt einen Einführungsabschnitt 6 für eine magneto-optische Platte oder eine optische Platte und einen Einführungsschlitz für eine IC-Karte 7. Die Platte und die IC-Karte können separat voneinander angeordnet sein oder über ein Kabel (nicht gezeigt) miteinander verbunden sein.
  • Die hochwirksame Kompression und die Codierung werden nun ausführlich erläutert. Das heißt, ein Verfahren zum Durchführen eines hochwirksamen Codierens in bezug auf digitale Eingangssignale, beispielsweise PCM-Audiosignale durch Subbandcodierung (SBC), adaptive Transformationscodierung (ATC) und adaptive Bitzuteilung wird zunächst mit Hilfe von 4 erläutert.
  • In der hochwirksamen Codiervorrichtung, welche in 4 gezeigt ist, wird der Frequenzbereich der digitalen Eingangssignale in mehrere Bänder unterteilt, so dass zwei benachbarte niedrigere Bänder eine gleiche Bandbreite haben, und die Bandbreiten progressiv in der Richtung steigender Frequenzen breiter werden. Die digitalen Eingangssignale werden von einem Frequenzband in das andere orthogonal-transformiert, um Frequenzbereichs-Spektraldaten zu erzeugen, welche mit der Anzahl von Bits codiert werden, die adaptiv auf der Basis sogenannter kritischer Bänder für den unteren Frequenzbereich zugeteilt werden. Diese adaptive Zuteilung berücksichtigt die Charakteristik des menschlichen Hörsinnes, wie später hier erläutert wird. Weiter werden kleinere Bänder von den kritischen Bändern für den höheren Frequenzbereich sub-unterteilt, um die Blockgleitwirksamkeit zu steigern. Dieser Block wird üblicherweise zum Block, der dem Quantisierungsrauschen unterworfen ist, d. h., dem Block, auf der Basis von dem das Quantisierungsrauschen erzeugt wird. Zusätzlich wird bei der vorliegenden Ausführungsform die Blockgröße oder Blocklänge adaptiv vor der Orthogonal-Transformation in Abhängigkeit von Eingangssignalen geändert, und das Lesen wird auf Blockbasis durchgeführt.
  • Gemäß 4 werden PCM-Audiosignale, die einen Frequenzbereich von 0 bis 22 kHz haben, mit der Abtastfrequenz von 44,1 kHz zu einem Eingangsanschluss 100 geliefert. Diese Eingangssignale werden durch ein Frequenzteilungsfilter 101, beispielsweise ein QMF-Filter in Signale unterteilt, die eine Frequenzbereich von 0 bis 11 kHz und einen Frequenzbereich von 11 bis 22 kHz haben. Die Signale, welche den Frequenzbereich von 0 bis 11 kHz haben, werden ähnlich durch ein ähnliches Frequenzteilungsfilter 102, beispielsweise ein QMF-Filter in Signale unterteilt, welche ein Frequenzband von 0 bis 5,5 kHz haben, und in Signale, die ein Frequenzband von 5,5 kHz bis 11 kHz haben. Die Signale der jeweiligen Bänder von den Frequenzteilungsfiltern 101, 102 werden zu einer Orthogonal-Transformations-Blockgrößen-Entscheidungsschaltung 106 zur Bestimmung der Blockgröße auf Bandbasis geliefert. Bei der orthogonalen Transformationsblockgrößen-Entscheidungsschaltung 106 basiert die Blockgrößenlänge beispielsweise auf der Länge von 11,6 ms, was die maximale Blockgröße ist. Wenn die Signale vorübergehend sub-stationär sind, wird die Orthogonal-Transformations-Blockgröße auf ihren Maximalwert von 11,6 ms festgelegt, um die Frequenzauflösung zu steigern. Wenn die Signale vorübergehend nicht-stationär sind, wird die orthogonale Transformationsblockgröße weiter in vier und acht Abschnitte unterteilt, für das Frequenzband, welches nicht höher als 11 kHz ist bzw. das Frequenzband, welches höher als 11 kHz ist, um die Zeitauflösung zu verbessern.
  • Unter den Verfahren zum Unterteilen der oben erwähnten digitalen Eingangssignale in mehrere Frequenzbänder gibt es ein QMF-Filter, wie dies beispielsweise in Digital Coding of Speech in Sub-Bands, R. E. Crochiere, Bell Syst. Tech. J., Band 55, Nr. 8, 1976 erläutert ist. Das Verfahren zur Filterunterteilung in gleiche Bandbreiten ist in Polyphase Quadrature Filters – A News Sub-band Coding Technique, Joseph H. Rothweiler, ICASSP 1983, Boston, erläutert.
  • Zurückkehrend zu 4 werden dort Ausgangssignale der Frequenzteilungsfilter 101, 102 der jeweiligen Frequenzbänder separat zu den Orthogonal-Transformationsschaltungen 103, 104 und 105 geliefert. Die Blockgrößen, welche durch die Orthogonal-Transformationsgrößen-Entscheidungsschaltung 106 bestimmt werden, werden zu den Orthogonal-Transformationsschaltungen 103 bis 105 geliefert, in denen Ausgangssignale verblockt werden, d. h., zu Blöcken in Abhängigkeit von den Blockgrößen zur Orthogonal-Transformation gebildet werden. 5 zeigt die Orthogonal-Transformations-Blockgrößen. Damit wird die Blockgröße von 11,6 ms (Lang-Modus) oder die Blockgröße von 2,9 ms (Kurz-Modus) für den niedrigen bis mittleren Frequenzbereich ausgewählt, und die Blockgröße von 11,6 ms (Lang-Modus) oder 1,45 ms (Kurz-Modus) wird für den Hochfrequenzbereich ausgewählt. Die ausgewählte Blockgröße wird an einem Anschluss 111 ausgegeben und somit zur Decodierschaltung geliefert.
  • Als Beispiele der oben beschriebenen Orthogonal-Transformation gibt es eine Orthogonal-Transformation, bei der zugeführte Audiosignale in Zeitblöcke von vorher festgelegter Länge (Rahmen) unterteilt sind und mit schneller Fourier-Transformation (FFT), Kosinus-Transformation (DCT) oder modifizierter DCT (MDCT) zur Transformation von Zeitbereichssignalen in Frequenzbereichssignalen unterteilt werden. Erläuterungen über MDCT können in Sub-band/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation, J. P. Princen, A. B. Bradley, ICASSP 1987, Univ. of. Surrey, Royal Melbourne Inst. of Tech., gefunden werden.
  • Die Bitzuteilungs-Berechnungsschaltung 107 berechnet im Hinblick auf den Maskierungseffekt die Maskierungshöhe für jedes kritische Band und jedes Band, welches von dem kritischen Band unterteilt ist, um das Blockgleiten auf der Basis der Spektraldaten in betracht zu ziehen, die unterteilt wurden, um die oben erwähnten kritischen Bänder und das Blockgleiten in betracht zu ziehen. Zusätzlich berechnet die Bitzuteilungs-Berechnungsschaltung 20 die Anzahl zugeteilter Bits für die jeweiligen Bänder auf der Basis der Energie oder Spitzenwerte für jedes der kritischen Bänder und der Bänder, welche von den kritischen Bändern unterteilt sind, um das Blockgleiten in betracht zu ziehen, und die Menge des Maskierens, und überträgt die resultierende Information zur adaptiven Bitzuteilungs- und Codierschaltung 108. Die adaptive Bitzuteilungs- und Codierschaltung 108 requantisiert die Spektraldaten oder die MDCT-Koeffizientendaten in Abhängigkeit von der Anzahl von Bits, die den jeweiligen Bändern in der Bitzuteilungs-Berechnungsschaltung 107 zugeteilt wurden. Die auf diese Weise codierten Daten werden an einem Ausgangsanschluss 110 ausgegeben.
  • 6 zeigt in einem schematischen Blockschaltungsdiagramm eine Anordnung einer konkreten Ausführungsform der Bitzuteilungs-Berechnungsschaltung 107, in welcher die Frequenzbereichs-Spektraldaten von den MDCT-Schaltungen 103 bis 105 zu einem Eingangsanschluss 21 geliefert werden.
  • Die Frequenzbereichs-Eingangsdaten werden zu einer Bandbasis-Energieberechnungsschaltung 22 übertragen, in welcher die Energien der kritischen Bänder und der Bänder, welche aus den kritischen Bändern unterteilt wurden, um das Blockgleiten und die Höhe des Maskierens in betracht zu ziehen, durch Berechnung der Gesamtsumme der Amplituden in den entsprechenden Bändern herausgefunden werden. Die Amplitudenspitzenwerte oder Mittelwerte können ebenfalls anstelle der Energien in den entsprechenden Bändern verwendet werden. Jede Spektralkomponente, welche den Summenwert der Amplituden jedes der entsprechenden Bänder zeigt, ist als SB in 7 als Ausgangssignal der Energieberechnungsschaltung 22 gezeigt. In 7 sind 12 Bänder B1 bis B12 als kritische Bänder dargestellt, und die Bänder, welche von den kritischen Bändern hilfs-unterteilt sind, um das Blockgleiten und die Höhe des Maskierens in betracht zu ziehen, um die Zeichnung zu vereinfachen.
  • Es sei angemerkt, dass eine Operation zum Multiplizieren jedes Spektralkomponente SB mit einer vorher festgelegten Wichtungsfunktion, um die Effekte des Maskierens in betracht zu ziehen, nun mittels Faltung durchgeführt wird. Zu diesem Zweck wird ein Ausgangssignal der Basisband-Energieberechnungsschaltung 22, d. h., jeder Wert der Spektralkomponente SB zu einer Faltungsfilterschaltung 23 übertragen. Die Faltungsfilterschaltung 23 besteht aus mehreren Verzögerungselementen, um sequentiell Eingangsdaten zu verzögern, mehreren Multiplizierern, beispielsweise 25 Multiplizierern, die mit den jeweiligen Bändern verknüpft sind, um Ausgangssignale der Verzögerungselemente mit Filterkoeffizienten oder Wichtungsfunktionen zu multiplizieren, und einem Addierer, um die Summe der Ausgangssignale der entsprechenden Multiplizierer herauszufinden. Durch diese Faltung wird die Summe der Bereiche, welche durch die unterbrochenen Linien in 7 angedeutet sind, herausgefunden. "Maskieren" bedeutet das Phänomen, bei dem bestimmte Signale durch andere Signale maskiert werden und aufgrund der Kennlinie des menschlichen Hörsinnes nicht hörbar werden. Der Maskierungseffekt kann in einen Zeitbereichs-Maskierungseffekt klassifiziert werden, der durch die Zeitbereichs-Audiosignale erzeugt wird, und den gleichlaufenden Maskierungseffekt, der durch die Frequenzbereichssignale erzeugt wird. Durch dieses Maskieren wird jegliches Rauschen, welches in einem maskierten Bereich vorhanden ist, unhörbar. Bei tatsächlichen Audiosignalen liegt das Rauschen innerhalb des makierten Bereichs in einem zulässigen Rauschen.
  • Bei einem konkreten Beispiel von Multiplikationskoeffizienten oder Filterkoeffizienten entsprechender Filter der Faltungsfilterschaltung 23, wenn der Koeffizient eines Multiplizierers M für ein beliebiges Band gleich 1 ist, werden Ausgangssignale der Verzögerungselemente mit Koeffizienten 0,15, 0,0019, 0,0000086, 0,4, 0,06 und 0,007 in den Multiplizierern M – 1, M – 2, M – 3, M + 1, M + 2 und M + 3 multipliziert, wobei M eine beliebige ganze Zahl von 1 bis 25 ist, um die Faltung der Spektralkomponenten SB durchzuführen.
  • Ein Ausgangssignal der Faltungsfilterschaltung 23 wird zu einem Subtrahierer 24 übertragen, um einen Pegel α herauszufinden, der einem zulässigen Rauschpegel im Faltungsbereich entspricht. Der zulässige Rauschpegel α ist ein derartiger Pegel, der einen zulässigen Rauschpegel für alle kritischen Bänder durch umgekehrtes Falten ergibt, wie nachfolgend beschrieben wird. Der Subtrahierer 24 wird mit einer Zulässigkeitsfunktion beliefert (einer Funktion, die für den Maskierungspegel repräsentativ ist), um den Pegel α herauszufinden. Der Pegel α wird durch Anheben und Vermindern der Zulässigkeitsfunktion gesteuert. Die Zulässigkeitsfunktion wird von einem (n – ai)-Funktionsgenerator 25 beliefert, was nun erläutert wird.
  • Das heißt, der Pegel α, der dem zulässigen Rauschpegel entspricht, wird aus der Gleichung (1) herausgefunden: α = S-(n – ai) (1)wobei I die Anzahl ist, die sequentiell den kritischen Bändern vom Beginn von der unteren Seite bewilligt ist, n und a Konstanten sind, wobei a > 0, und S die Intensität des gefalteten Bark-Sektrums ist. In der Gleichung (1) zeigt (n – ai) die Erlaubnisfunktion. Bei der vorliegenden Ausführungsform kann durch Setzen, so dass n = 38 und a = 1, optimales Codieren ohne Verschlechterung der Tonqualität erreicht werden.
  • Der Pegel α wird auf diese Weise bestimmt und zu einem Teiler 26 übertragen, um den Pegel α im gefalteten Bereich zurück zu falten. Durch dieses Zurückfalten wird das Maskierungsspektrum aus dem Pegel α herausgefunden. Dieses Maskierungsspektrum wird zum zulässigen Rauschpegel. Obwohl die Zurückfaltung komplexe Rechenschritte notwendig macht, wird sie bei der vorliegenden Ausführungsform in einer vereinfachten Weise unter Verwendung des Teilers 26 durchgeführt.
  • Das Maskierungsspektrum wird über eine Synthesizer-Schaltung 27 zu einem Subtrahierer 28 übertragen, der mit einem Ausgangssignal der Bandbasis-Energieermittlungsschaltung 22 beliefert wird, d. h., den oben erwähnten Spektralkomponenten SB. Der Subtrahierer 28 subtrahiert das Maskierungsspektrum vom Spektrum SB, um die Bereiche der Spektralkomponenten SB zu maskieren, die niedriger sind als der Pegel des Maskierungsspektrums MS, wie in 8 gezeigt ist.
  • Ein Ausgangssignal des Subtrahierers 28 wird über eine Zulässigkeitsrausch-Korrekturschaltung 30 an einem Ausgangsanschluss 31 ausgegeben und daher zu einem nicht gezeigten ROM übertragen, in welchem die Information, welche die Anzahl der zugeteilten Bits betrifft, vorher gespeichert ist. Der ROM gibt die Information, welche die Anzahl zugeteilter Bits für jedes Band betrifft, in Abhängigkeit von einem Ausgangssignal der Subtraktionsschaltung 28, die über eine Zulässigkeitsrausch-Korrekturschaltung 30 geliefert wurde, aus, d. h., in Abhängigkeit vom Pegel eines Unterschieds zwischen den Energien der entsprechenden Bänder und den Ausgangssignalen der Rauschpegel-Einstellungseinrichtung. Die Information, welche die Anzahl der zugeteilten Bits betrifft, wird zu einer adaptiven Bitzuteilungs- und Codierschaltung 108 übertragen, um zuzulassen, dass die Frequenzbereichs-Spektraldaten von den MDCT-Schaltungen 103 bis 105 mit der Anzahl von Bits quantisiert werden, die den entsprechenden Bändern zugeteilt sind.
  • Zusammengefasst quantisiert die adaptive Bitzuteilungs- und Codierschaltung 108 die Bandbasis-Spektraldaten mit der Anzahl von Bits in Abhängigkeit von der Menge der Maskierung und des Pegels der Differenz zwischen dem Ausgangssignal der Rauschpegel-Einstellungseinrichtung und den Energien in den kritischen Bändern und den Bändern, welche von den kritischen Bändern abgeteilt sind, um das Blockgleiten in betracht zu ziehen. Die Verzögerungsschaltung 29 ist dazu vorgesehen, die Spektralkomponenten SB von der Energieermittlungsschaltung 22 in Abwägung der Verzögerung, welche in der Schaltung stromaufwärts der Synthesizer-Schaltung 27 erzeugt wird, zu verzögern.
  • Die Synthesizer-Schaltung 27 baut das Maskierungsspektrum MS und Daten von der minimalen Hörbarkeitskurve RC von der Minimal-Hörbarkeitskurve-Erzeugungsschaltung 32, welche die Charakteristik des menschlichen Hörsinns zeigt, wie in 9 gezeigt ist, künstlich auf. Wenn der absolute Rauschpegel niedriger ist als die minimale Hörbarkeitskurve, wird das Rauschen unhörbar. Die minimale Hörbarkeitskurve unterscheidet sich in bezug auf die Differenz in einem Wiedergabepegel sogar, obwohl das Codieren in der gleichen Weise durchgeführt wurde. Da jedoch es keinen deutlichen Unterschied in der Weise gibt, in den 16-Bit-Dynamikbereich in Musik bei tatsächlichen Digitalsystemen einzudringen, kann man annehmen, dass, wenn das Quantisierungsrauschen des Frequenzbereichs in der Nähe von 4 kHz liegt, wobei diese Frequenz am meisten für das Ohr wahrnehmbar ist, das Quantisierungsrauschen, welches niedriger ist als der Pegel der Minimal-Hörbarkeitskurve, in keinem anderen Frequenzbereich nicht gehört wird. Wenn man annimmt, dass die Aufzeichnungs-/Wiedergabevorrichtung so verwendet wird, dass das Rauschen in der Nähe von 4 kHz (für eine Wortlänge, welche durch das System verwendet wird) nicht gehört wird, und der zulässige Rauschpegel durch Synthesieren der minimalen Hörbarkeitskurve RC und des Maskierungsspektrums Ms erhalten werden soll, kann der zulässige Rauschpegel bis zu dem Pegel sein, der durch die schraffierten Linien in 9 angedeutet ist. Bei der vorliegenden Ausführungsform passt der Pegel von 4 kHz bei der Minimal-Hörbarkeitskurve zum Minimalpegel, der beispielsweise 20 Bits entspricht. In 9 ist außerdem das Spektralspektrum SS gezeigt.
  • Zusätzlich korrigiert die Zulässigkeitsrausch-Korrekturschaltung 30 den zulässigen Rauschpegel im Ausgangssignal des Subtrahierers 28 auf der Basis der Information der Gleichlautstärkenkurve, welche von einer Korrekturinformations-Ausgabeschaltung 33 übertragen wird. Die Gleichlautstärkekurve ist eine charakteristische Kurve, welche die Charakteristik des menschlichen Hörsinnes betrifft, und sie wird dadurch erhalten, dass die Tondrücke des Tons bei den jeweiligen Frequenzen, die mit der gleichen Lautstärke gehört werden wie der reine Ton von 1 kHz gefunden werden und die Tondrücke durch eine Kurve verbunden werden. Diese ist auch als Gleichlautstärken-Empfindlichkeitskurve bekannt. Die Gleichlautstärkenkurve beschreibt außerdem eine Kurve, welche im Wesentlichen die gleiche ist wie die Minimal-Hörbarkeitskurve, die in 9 gezeigt ist. Mit der Gleichlautstärkenkurve wird der Ton in der Nachbarschaft von 4 kHz mit der gleichen Lautstärke wie der Ton von 1 kHz gehört, sogar, obwohl der Tondruck um 8 bis 10 db vom Ton von 1 kHz vermindert wurde. Der Ton in der Nachbarschaft von 50 kHz kann umgekehrt jedoch nicht mit der gleichen Lautstärke wie der Ton von 1 kHz gehört werden, wenn der Tondruck nicht um ungefähr 15 db höher ist als der des Tons von 1 kHz. Damit sieht man, dass Rauschen im Übermaß des Pegels der Minimal-Hörbarkeitskurve und innerhalb des zulässigen Rauschpegels vorzugsweise Frequenzcharakteristiken hat, die durch eine Kurve in Übereinstimmung mit der Gleichlautstärkenkurve gezeigt werden. Somit kann man sehen, dass eine Korrektur des zulässigen Rauschpegels im Hinblick auf die Gleichlautstärkenkurve in Übereinstimmung mit der Kennlinie des menschlichen Hörsinns ist.
  • Die Korrekturinformations-Ausgabeschaltung 33 kann so ausgebildet werden, den zulässigen Rauschpegel auf der Basis der Information des Fehlers zwischen dem Ermittlungsausgangssignal des Volumens der Ausgabeinformation (Datenmenge) im Zeitpunkt der Quantisierung in der adaptiven Bitzuteilungs- und Codierschaltung 108 und der Zielbitrate der schließlich codierten Daten zu korrigieren. Es gibt Gelegenheiten, wo die Gesamtzahl von Bits, welche durch vorübergehende adaptive Bitzuteilung für die Gesamtheit der Bitzuteilungs-Einheitsblöcke erhalten wird, von der vorher festgelegten Anzahl von Bits (Zielanzahl der Bits) verschieden ist, wie durch die Bitrate der endgültig codierten Daten bestimmt wird, und daher die Bitzuteilung wiederum so gemacht wird, dass die Differenz gleich null wird. Das heißt, wenn die Gesamtzahl der zugeteilten Bits kleiner ist als die Zielanzahl der Bits, werden die Bits entsprechend der Differenz additiv entsprechenden Einheitsblöcken zugeteilt, während die Gesamtzahl der zugeteilten Bits größer ist als die Zielanzahl der Bits, die Bits entsprechend der Differenz deduktiv den jeweiligen Einheitsblöcken zugeteilt werden.
  • Zu diesem Zweck wird ein Fehler in der Gesamtanzahl von zugeteilten Bits von der Zielanzahl ermittelt, und Korrekturdaten zum Korrigieren der Anzahl der zugeteilten Bits werden durch die Korrekturinformations-Ausgangsschaltung 33 in Abhängigkeit von den Fehlerdaten ausgegeben. Wenn die Fehlerdaten das Kürzen der Anzahl von Bits zeigen, ist es wahrscheinlich, dass mehrere Bits pro Einheitsblock verwendet werden, so dass die Menge der Daten über der Zielzahl von Bits liegt. Wenn die Fehlerdaten einen Überschuss der Anzahl von Bits zeigen, ist es wahrscheinlich, dass eine kleinere Anzahl von Bits pro Einheitsblock ausreicht, so dass die Menge der Daten geringer ist als die Zielzahl. Folglich ist die Korrekturinformations-Ausgabeschaltung 33 verantwortlich für die Fehlerdaten, um die Daten von Korrekturwerten auszugeben, um die der zulässigen Raumspegel bei einem Aus gangssignal des Subtrahierers 28 auf der Basis der Information der Gleichlautstärkenkurve korrigiert wird. Die Korrekturwerte werden zu der Zulässigkeitsrausch-Korrekturschaltung 30 übertragen, um das zulässige Rauschen vom Subtrahierer 28 zu korrigieren. Mit dem oben beschriebenen System werden Daten, welche durch Verarbeiten des Orthogonal-Transformations-Ausgangsspektrums durch die subsidiäre Transformation zur Quantisierung erhalten werden, als Hauptinformation erhalten, während der Maßstabsfaktor, der den Zustand des Blockgleitens oder der Wortlängedaten zeigt, als subsidiäre Information zum Quantisieren erzeugt wird. Die Hauptinformation und die subsidiäre Information werden vom Codierer zum Decoder übertragen.
  • Die Bitzuteilungs-Berechungsschaltung 107 ist so aufgebaut, wie beispielsweise in 10 gezeigt ist. Das folgende wirksame Verfahren zur Bitzuteilung, welches gegenüber dem oben beschriebenen Verfahren der Bitzuteilung verschieden ist, wird mit Hilfe von 10 erläutert.
  • Die Ausgangssignale der MDCT-Schaltungen 103 bis 105 in 4 werden über einen Eingangsanschluss 300 von 10 zu einer Energieberechnungsschaltung 301 übertragen, die zur Berechnung der Bandbasisenergien bestimmt ist. In der Bandbasis-Energieberechnungsschaltung 301 werden die Signalenergien für jedes der kritischen Bänder und jedes der sub-unterteilten Bänder für höhere Frequenzen durch Berechnen von Effektivwerten der Amplituden in den jeweiligen Bändern gefunden. Die Spitzenwerte oder die Mittelwerte der Amplituden können anstelle der Bandbasisenergien verwendet werden.
  • Die Bandbasis-Spektralkomponenten der Summen der jeweiligen kritischen Bänder oder der Bänder, welche von den kritischen Bändern für die höheren Frequenzen hilfs-unterteilt sind, welche von der Energieberechnungsschaltung 301 ausgegeben werden, werden zu Spektralkomponenten SB (Bark-Spektrum), welche in 7 gezeigt sind.
  • Wenn hei der vorliegenden Ausführungsform die Anzahl von Bits, welche MDCT-Koeffizienten zeigen, welche zur Übertragung oder zum Aufzeichnen verwendet werden, 1 kbits/s ist, wird ein festes Bitzuteilungsmuster bei der vorliegenden Ausführungsform unter Verwendung von 1 kbits gebildet. Bei der vorliegenden Ausführungsform werden mehrere Bitzuteilungsmuster für die feste Bitzuteilung verwendet und können selektiv in Abhängigkeit von den Signaleigenschaften verwendet werden. Bei der vorliegenden Ausführungsform hat die Festbit-Zuteilungsschaltung 307 eine Vielzahl von Mustern, bei denen die Bits von Kurzzeitblöcken entsprechend 1 kbits für die jeweiligen Frequenzen verteilt werden. Die Festbit-Zuteilungsschaltung 307 besitzt mehrere Muster, die unterschiedliche Bitzuteilungsverhältnisse für die mittleren bis niedrigen Frequenzen und für die hohen Frequenzen haben. Ein solches Muster wird ausgewählt, welches die kleinere Anzahl von Bits hat, welche den hohen Frequenzen für kleinere Signalgrößen zugeteilt wird. Auf diese Weise wird es möglich, den Vorteil des Lautstärkeeffekts anzunehmen, bei dem die Empfindlichkeit für die höheren Frequenzen für die kleineren Signalgrößen niedriger wird. Obwohl die Größe der Vollbereichssignale als Signalgröße verwendet werden kann, ist es auch möglich, ein MDCT-Ausgangssignal oder ein Ausgangssignal der Nichtblockbildungs-Frequenzunterteilungsschaltung zu nutzen, welches beispielsweise ein Filter verwendet. Die Anzahl nutzbarer Bits von 1 kbits wird beispielsweise in einer Eingabeschaltung 305 für eine nutzbare Gesamtbitzahl festgelegt. Die Gesamtzahl von Bits kann von außen eingegeben werden.
  • Das Ausgangssignal der Energieberechnungsschaltung 301 wird außerdem zu einer energie-abhängigen Bitzuteilungsschaltung 306 übertragen, welches das energie-abhängige Bitzuteilungsmuster von den Bandbasisenergien herausfindet. Die energie-abhängigen Bitmuster werden so festgelegt, dass, je größer die Energien eines vorher festgelegten Bandes sind, desto größer die Anzahl von Bits ist, die dem Band zugeteilt wird.
  • Gemäß 10 ist das Verteilungsverhältnis zwischen dem festen Bitzuteilungsmuster und der Bitzuteilung in Abhängigkeit vom Bark-Spektrum (Spektrum SB) durch einen Index festgelegt, der die Glattheit des Signalspektrums zeigt. Das heißt, dass bei der vorliegenden Ausführungsform ein Ausgangssignal der Energieberechnungsschaltung 301 zu einer Spektralglättungs-Berechnungsschaltung 302 geliefert wird, in der die Summe der Absolutwerte der Unterschiede zwischen benachbarten Werten der Signalspektralkomponenten, welche durch die Summe der Signalspektralkomponenten geteilt ist, herausgefunden wird und als Index der Signalspektralglätte (Tonalität) verwendet wird. Wenn diese Tonalität bestimmt ist, wird das oben erwähnte Verteilungsverhältnis in der Bitverteilungsverhältnis-Entscheidungsschaltung 304 herausgefunden. Das Verteilungsverhältnis wird dazu verwendet, um das Wichtungsverhältnis zwischen der festen Bitzuteilung und der energie-abhängigen Energieverteilung zu ändern.
  • Die Bitverteilungs-Verhältnisdaten von der Bitverteilungsverhältnis-Entscheidungsschaltung 304 werden einem Multiplizierer 312 bereitgestellt. Dem Multiplizierer 312 wird ebenfalls ein Ausgangssignal der Festbit-Verteilungsschaltung 307 bereitgestellt, während dieses ebenfalls einem Multiplizierer 311 bereitgestellt wird, der mit einem Ausgangssignal der energie-abhängigen Bitverteilungsschaltung 306 beliefert wird. Ausgangssignale dieser Multiplizierer 311, 312 werden zu einer Summierschaltung 308 geliefert. Das heißt, die Anzahl von Bits, welche durch die Festbitverteilung bestimmt wird, und die Anzahl von Bits durch die spektral-abhängige Bitverteilung (auf der Basis von Energien der kritischen Bänder und der Bänder, welche von den kritischen Bänder für die höheren Frequenzen hilfs-unterteilt sind) werden jeweils mit den Werten des oben erwähnten Verteilungsverhältnisses multipliziert, und die resultierenden Produkte werden durch die Summierschaltung 308 summiert. Die resultierenden Summendaten werden über einen Ausgangsanschluss 309 (Ausgangsanschluss der Bandbasis-Bitzuteilung) zu einer stromabwärtigen Schaltung geliefert, um zur Quantisierung verwendet zu werden.
  • Die Art und Weise der Bitzuteilung in diesem Zeitpunkt ist in 11b und 12b gezeigt. Der Zustand des verknüpften Quantisierungsrauschens ist in 11a und 12a gezeigt. 11a und 11b zeigen ein flacheres Signalspektrum, während 12a und 12b das Signalspektrum zeigen, welches hohe Tonalität zeigt. In 11b und 12b zeigt Qs den Signalpegel in Abhängigkeit von der Bitquantität, und QF zeigt die Bitquantität entsprechend der festen Bitzuordnung. In 11a und 12a zeigt L den Signalpegel, und Ns und NF zeigen den Signalpegel in Abhängigkeit von der Rauschreduktion bzw. den Rauschpegel aufgrund der festen Bitzuordnung.
  • In 11b, welche das flachere Signalspektrum zeigt, ist die Bitzuteilung aufgrund einer größeren Menge der festen Bitzuteilung dazu nützlich, ein größeres Signal gegenüber dem Rauschverhältnis über den gesamten Frequenzbereich sicherzustellen. In 11b wird jedoch eine kleinere Anzahl von Bits für den unteren und höheren Frequenzbereich zugeordnet, da diese Bereiche gegenüber dem Hörsinn weniger kritisch sind. Durch die signalpegel-abhängige Zuteilung einer kleineren Anzahl von Bits für die niedrigen und hohen Frequenzen, wie mit Qs in 11 gezeigt ist, wird der Rauschpegel der Bänder, die größere Signalgrößen aufweisen, selektiv reduziert. Folglich wird die Frequenzbereichsselektivität für ein flacheres Signalspektrum breiter.
  • Wenn umgekehrt das Signalspektrum hohe Tonalität zeigt, wie in 12b gezeigt ist, wird eine große Anzahl von Bits durch den Signalpegel in Abhängigkeit von der Bitzuteilung dazu verwendet, das Quantisierungsrauschen eines extrem engen Bandes zu reduzieren, welches durch NS in 12a gezeigt ist. Dies verbessert die Kennlinie der alleinigen Spektraleingangssignale. Außerdem kann der Rauschpegel über einen weiten Frequenzbereich durch die kleinere Anzahl von Bits durch feste Bitzuordnung nicht-selektiv-reduziert werden.
  • Wenn man nun zu 4 zurückkehrt, so wird nun die adaptive Zuteilungs- und Codierschaltung 108 erläutert. Bei der vorliegenden Ausführungsform gibt es zwei Bitratenmodi A und B beispielsweise mit dem Bitratenmodus A mit 128 kbps/pro Kanal und mit dem Bitratenmodus 8, der eine Hälfte des Bitratenmodus für den Modus A oder 64 kbps/Kanal hat. Es können jedoch auch mehr als zwei Bitratenmodi sein.
  • Zunächst wird das Codierverfahren für den Modus A (A-Modus) erläutert.
  • 13 und 14 zeigen ein typisches Beispiel der Blockgleitbandunterteilung für den Modus A. In 13, bei der die orthogonale Transformationsblockgröße 11,6 ms ist, und in 14, in welcher der Frequenzbereich in vier bzw. acht für den niedrigen bis mittleren Frequenzbereich bzw. für den hohen Frequenzbereich unterteilt ist, ist die Gesamtzahl der Blockgleitbänder die gleiche und gleich 52. Wie für die Anzahl der Blockgleitbänder gibt es als Ausgangssignale der Frequenzteilungsfilter 101 und 102 20 Blockgleitbänder für den unteren Frequenzbereich und 16 Blockgleitbänder für den mittleren bis hohen Frequenzbereich. Da diese Zahlen ungeachtet der orthogonalen Transformationsblockgröße fest bleiben, entsteht kein Nutzen, sogar, obwohl die orthogonale Transformationsblockgröße unabhängig von Band zu Band geändert wird. Wenn man beispielsweise annimmt, dass die Blockgröße gleich 1,6 ms ist, welche durch vier lediglich für den unteren Frequenzbereich geteilt wird, wobei die Blockgröße 11,6 ms für den mittleren bis hohen Frequenzbereich ist, wird die Gesamtzahl der Blockgleitbänder gleich 52, wenn der untere Frequenzbereich bzw. der mittlere bis hohe Frequenzbereich unterteilt werden, wie in 14 bzw. 13 gezeigt ist. In der adaptiven Bitzuteilungs-Codierschaltung 108 werden die Informationsdaten für den Maßstabsfaktor und die Wortlänge für jedes der 52 Blockgleitbänder bewilligt, wobei die Spektraldaten in Abhängigkeit von den bewilligten Maßstabsfaktoren und Wortlängen quantisiert und codiert werden.
  • Die codierten Daten werden am Ausgangsanschluss 110 zum Aufzeichnen oder zur Übertragung ausgegeben.
  • Anschließend wird das Codierverfahren für den Modus B erläutert. Da die Bitrate für den Modus B eine Hälfte von der des Modus A beträgt, wird das Volumen der subsidiären Information, beispielsweise der Maßstabsfaktor, die Wortlänge oder dgl., nicht geändert, und lediglich das Volumen der Hauptinformation, d. h., der Spektraldaten wird vermindert, wenn das Codierverfahren das gleiche bleibt wie dasjenige, welches für den Modus A verwendet wird. Das heißt, dass beim Modus B die Proportion der subsidiären Information im gesamten Informationsvolumen vergrößert wird, und folglich die Codierwirksamkeit im Vergleich zum Modus A abgesenkt wird. Wenn die Bitrate halbiert wird, ist es wünschenswert, dass nicht nur das Volumen der Hauptinformation, sondern auch das Volumen der Hilfsinformation auf eine Hälfte oder weniger vermindert wird. Bei der vorliegenden Ausführungsform wird die Verminderung des Volumens der Hilfsinformation dadurch erreicht, indem man den Wert der Hilfsinformation zwischen zwei zeitlich benachbarten Blöcken hat. Das heißt, zum Halbieren des Volumens der Hilfsinformation für den Modus B im Vergleich zu dem für den Modus A. Da das Volumen der Hilfsinformation für den Modus A grundsätzlich das gleiche ist wie das der Anzahl der Blockfrequenzbänder, ist dieses gleich 52/11,6 ms. Da für den Modus B das Blockgleitband längs der Zeitachse erweitert ist, beträgt das Volumen der Hilfsinformation gleich 52/23,2 ms. Somit ist das Volumen der Hilfsinformation innerhalb des gleichen Zeitintervalls für den Modus B die Hälfte wie das für den Modus A. 15 bis 17 zeigen ein Beispiel einer Blockgleitbandunterteilung für den Modus B.
  • In der grafischen Darstellung von 15 sind die orthogonalen Transformationsblockgrößen zwei seitlich benachbarter Blöcke vom Langmodus. Die Bereiche, die durch durchgezogene Linien begrenzt sind, zeigen jeweils einen orthogonalen Transformationsblock, während gestrichelte Bereiche jeweils ein einzelnes Blockgleitband oder einen Bereich zeigen, der durch eine und die gleiche Hilfsinformation dargestellt wird.
  • Das heißt, dass die in 15 gezeigten Blockgleitbänder durch Vereinheitlichen von zwei Blockgleitbändern gebildet sind, die längs der Zeitachse für den Modus A benachbart sind, wie in 13 gezeigt ist. Anders ausgedrückt wird die Hilfsinformation, wie diese für zwei zeitlich benachbarte Blockgleitbänder für den Modus A in 13 festgelegt ist, allgemein so verwendet, dass die gleiche Hilfsinformation für diese zwei Blockgleitbänder festgelegt wird.
  • Gesehen längs der Frequenzachse ist die Beziehung zwischen den Blockgleitbändern und der Hilfsinformation die gleiche, wie die, die in 13 gezeigt ist.
  • In der grafischen Darstellung von 16 sind die beiden orthogonalen Transformationsblockgrößen von zwei zeitlich benachbarten Blöcken vom Kurzmodus. Die Bereiche, die durch durchgezogene Linien begrenzt sind, zeigen ebenfalls einen orthogonalen Transformationsblock, während gestrichelte Bereiche jeweils ein einzelnes Blockgleitband zeigen. Das heißt, dass die in 16 gezeigten Blockgleitbänder durch Vereinheitlichung von zwei Blockgleitbändern gebildet sind, die längs der Zeitachse für den Modus A benachbart sind, wie in 14 gezeigt ist. Die Art von Frequenzunterteilung in Bänder längs der Frequenzachse ist die gleiche wie die, die in 14 gezeigt ist.
  • In der grafischen Darstellung von 17 unterscheidet sich die orthogonale Transformationsblockgröße zwischen zwei zeitlich benachbarten Blöcken, d. h., die orthogonalen Transformationsblockgrößen dieser Blöcke bestehen aus der Kombination der Kurz- und Lang-Modi. Die Bereiche, welche durch durchgezogene Linien begrenzt sind, zeigen jeweils einen orthogonalen Transformationsblock, während gestrichelte Bereiche jeweils ein einzelnes Blockgleitband zeigen. Die Blöcke, die die orthogonale Transformationsblockgröße des Kurz-Modus haben, d. h., die Blöcke für den mittleren Bereich von 0 bis 11,6 ms und für den niedrigen und hohen Bereich von 11,6 bis 23,2 ms in 17 sind die gleichen wie diejenigen des Kurz-Modus, der in 16 gezeigt ist.
  • Ausführlicher ausgedrückt sind die beiden Bänder, die längs der Zeitachse des Blockgleitbands des Modus A, der in 14 gezeigt ist, zeitlich benachbart sind, zusammengruppiert. Anders ausgedrückt wird die Hilfsinformation, wie diese in den beiden zeitlich benachbarten Blockgleitbändern festgelegt ist, gemeinsam verwendet, so dass die gleiche Hilfsinformation für die beiden Blockgleitbänder festgelegt ist.
  • Gesehen längs der Frequenzachse verbleiben die Art und Weise der Frequenzunterteilung in Bänder und die Beziehung zwischen den Blockgleitbändern und der Hilfsinformation die gleiche wie die, die in 14 gezeigt sind.
  • Da für die Blöcke, welche die orthogonale Transformationsblockgröße des Lang-Modus haben, d. h., die Blöcke für den niedrigen und hohen Bereich von 0 bis 11,6 ms und den mittleren Bereich von 11,6 bis 23,2 ms, wie in 17 gezeigt ist, da die Blockgleitbänder in diesen Blöcken nicht längs der Zeitachse unterteilt sind, es unmöglich ist, die Bänder längs der Zeitachse zu vereinheitlichen oder die gemeinsamen Hilfsdaten zwischen benachbarten Blockgleitbändern zu verwenden, werden die beiden Bänder, welche einander längs der Frequenzachse benachbart sind, zu einem Band als Ausnahmemaßnahmen vereinheitlicht. Alternativ wird die Hilfsinformation, da diese für zwei Blockgleitbänder festgelegt wird, die einander längs der Frequenzachse benachbart sind, allgemein verwendet, so dass die gleiche Hilfsinformation für diese beiden Blockgleitbänder festgelegt ist. Wenn man längs der Zeitachse sieht, ist die Beziehung zwischen den Blockgleitbändern und der Hilfsinformation die gleiche wie die, die in 13 gezeigt ist.
  • Um somit die Anzahl der Hilfsdaten für den Modus B im Vergleich zu der für den Modus A zu halbieren, werden die beiden Blockgleitbänder, welche einander längs der Zeitachse oder der Frequenzachse benachbart sind, gemeinsam verwendet, oder die Hilfsinformation, da diese für die beiden Blockgleitbänder festgelegt ist, die einander längs der Zeitachse oder der Frequenzachse benachbart sind, wird gemeinsam verwendet. Dies erlaubt, dass die gleiche Hilfsinformation für diese beiden Blockgleitbänder verwendet wird. Als Ergebnis kann verhindert werden, dass die Hauptinformation signifikant mit einer Reduktion der Bitrate vermindert wird, während die Codierwirksamkeit verbessert werden kann.
  • 18 zeigt ein Beispiel einer adaptiven Bitzuteilungs- und Codierschaltung 108 für den Modus B, bei der die Information der orthogonalen Transformationsblockgröße und die Spektraldaten für die oben erwähnten Spektraldaten (MDCT-Koeffizienten) zu Anschlüssen 401 bzw. 402 geliefert werden. Die Information, welche die orthogonale Transformati onsblockgröße betrifft, wird zu einer Maßstabsfaktor-Rücksetzschaltung 405 und zu einer Wortlängen-Rücksetzschaltung 406 geliefert, während die Spektraldaten (MDCT-Koeffizienten) zu einem Quantisierer 408 geliefert werden.
  • Die Maßstabsfaktoren A für die zeitlich benachbarten beiden Blockgleitbänder werden, wie für die jeweiligen Bänder im Zeitpunkt der Blockgleitbandunterteilung für den Modus A festgelegt und über eine Eingangsschaltung 403 geliefert, durch die Maßstabsfaktor-Wiedereinstellungsschaltung 405 zusammen gruppiert, so dass der Maßstabsfaktor B für den Modus B zurückgesetzt ist. Üblicherweise wird der größere der beiden Maßstabsfaktoren A ausgewählt und als gemeinsamer Maßstabsfaktor verwendet.
  • Ähnlich wird die Wortlänge B für den Modus B durch die Wortlängen-Rücksetzschaltung 406 von den Wortlängen A zurückgesetzt, welche für die entsprechenden Bänder im Zeitpunkt der Unterteilung in Blockgleitbänder festgelegt ist und welche über eine Eingangsschaltung 404 geliefert wird. Beim Zurücksetzen der Wortlänge wird beispielsweise die größere der beiden Wortlängen A ausgewählt. Alternativ kann ein Mittelwert der beiden Wortlängen A verwendet werden.
  • Zwei Blöcke (23,2 ms) jeweils des Maßstabsfaktors A und die Wortlänge A werden jeweils als eine Einheit zu den Rücksetzschaltungen 405 bzw. 406 geliefert.
  • Die zurückgesetzten Wortlängendaten werden dann durch die Wortlängen-Rücksetzschaltung 406 auf Fehler korrigiert, welche durch die Rücksetzoperation in Verbindung mit der Gesamtzahl von Bits erzeugt werden. Der Maßstabsfaktor B und die Wortlänge B, die zurückgesetzt sind, werden zu einem Quantisierer 408 und einem Codierer 409 geliefert, um somit während der Quantisierung der Spektraldaten verwendet zu werden. Die quantisierten und die codierten Spektraldaten werden als codierte Daten B an einem Anschluss 410 ausgegeben.
  • Bisher wurde eine Beschreibung der Funktion der Codiervorrichtung angegeben, die zum Codieren der chronologischen PCM-Signale verwendet wird. Betrachtet man die Ausführungsform, welche in 19 gezeigt ist, so wird nun eine Erläuterung der Umsetzung von den codierten Daten des Modus A in die codierten Daten des Modus B und die der Umsetzung der codierten Daten des Modus B in die codierten Daten des Modus A angegeben.
  • Zunächst werden für die Umsetzung des Modus A in den Modus B die codierten Daten A, welche mit dem Modus A codiert sind, zu einem Eingangsanschluss 501 geliefert, während die codierte orthogonale Transformationsblockgrößeninformation zu einem Eingangsanschluss 503 geliefert wird. Die orthogonale Transformationsblock-Größeninformation wird in einem Code-Umsetzer 508 code-umgesetzt von dem Code, der die orthogonale Trans formationsblockgröße für den Modus A zeigt, in den Code, der die für den Modus B zeigt. Die code-umgesetzte Information wird zu einer Bitzuteilungs-Berechnungsschaltung 507 übertragen, während sie außerdem an einem Ausgangsanschluss 513 ausgegeben wird.
  • Die Funktion des Code-Umsetzers 508 besteht einfach darin, die orthogonale Transformationsblockgrößeninformation für zwei Blöcke für den Modus A zu kopieren und die resultierende Information durch das Codieren für den Modus B zu codieren, ohne irgendwelche Änderungen im Inhalt der Information zu veranlassen.
  • Die codierten Daten A werden zu einer adaptiven Bitzuteilungs- und Codierschaltung 505 geliefert, wo sie durch Decodieren und inverse Quantisierung zu Spektraldaten wiederhergestellt werden. Die resultierenden Spektraldaten werden zu einer Bitzuteilungs- und Berechnungsschaltung 507 zur Bitzuteilung übertragen. Die Bitzuteilungs- und Berechnungsschaltung 507 hat die gleiche Funktion wie die oben erwähnte Bitzuteilungs-Berechnungsschaltung 107.
  • Die wiederhergestellten Spektraldaten werden zu einer adaptiven Bitzuteilungs- und Codierschaltung 506 für den Modus B geliefert, damit sie gemäß dem Modus B wie oben erwähnt codiert werden. Die quantisierten und codierten Daten B werden an einem Ausgangsanschluss 511 ausgegeben. Somit wird die Umsetzung vom Modus A in den Modus B durch eine vereinfachte Schaltung ausgeführt, die aus der Kombination der Decodierschaltung für den Modus A und der Codierschaltung für den Modus B besteht, um eine Hochgeschwindigkeitsumsetzung zu ermöglichen.
  • Zur Umsetzung vom Modus B in den Modus A werden die codierten Daten B (mit dem Modus B codiert) zu einem Eingangsanschluss 512 geliefert, während die codierte orthogonale Transformationsblockgrößeninformation zu einem Eingangsanschluss 514 geliefert wird. Die orthogonale Transformationsblockgrößeninformation wird durch einen Code-Umsetzer 509 von dem Code, der die orthogonale Transformationsblockgröße für den Modus B zeigt, in den Code, der die orthogonale Transformationsblockgröße für den Modus A zeigt, code-umgesetzt. Die code-umgesetzte Blockgrößeninformation wird zu einer Formatumsetzungsschaltung 510 übertragen, wobei sie an einem Ausgangsanschluss 504 ausgegeben wird.
  • Die Funktion des Code-Umsetzers 509 ist umgekehrt zu der des Code-Umsetzers 508 und besteht lediglich aus dem Unterteilen der codierten orthogonalen Transformationsblockgrößeninformation für den Modus B in die codierten Daten für zwei Blöcke für den Modus A.
  • Die codierten Daten B werden zur Formatumsetzungsschaltung 510 geliefert, wodurch die codierten Daten unmittelbar in Daten des Formats des Modus A umgesetzt werden, bevor sie an einem Ausgangsanschluss 502 ausgegeben werden. Damit besteht keine wesentliche Änderung der Bitrate zwischen den beiden Modi, so dass lediglich ungefähr eine Hälfte der Hauptinformation bei dem Format des Modus A verwendet wird. Es ist auch möglich, das Decodieren und die Wiederzuteilung von Bits im Anschluss an das Codieren auszuführen, wie bei der oben erwähnten Umsetzung vom Modus A in den Modus B. Jedoch wird die Tonqualität durch Requantisieren verschlechtert, sogar, obwohl das wesentliche Informationsvolumen vergrößert wird. Da die Umsetzung vom Modus B in den Modus A durch Formatumsetzung erreicht werden kann, d. h., durch einfaches Umordnen von codierten Daten, kann die Umsetzungsgeschwindigkeit weiter gesteigert werden.
  • Mit Hilfe von 20 wird die Decodiervorrichtung erläutert. Die codierten Daten im Frequenzbereich werden von einem Ausgangsanschluss 110 von 4 zu einem Eingangsanschluss von 210 geliefert. Die codierten Daten werden zuerst zu einer Decodierschaltung 208 zur adaptiven Bitzuteilung geliefert und dadurch in Spektraldaten im Frequenzbereich decodiert.
  • Die orthogonale Transformationsblockgrößeninformation von der Codiervorrichtung von 19 wird zu einem Eingangsanschluss 211 geliefert und davon zu den inversen Orthogonal-Transformationsschaltungen 203, 204 und 205 für die jeweiligen Bänder geliefert. Von den obigen Spektraldaten werden die Daten für das Band von 0 bis 5,5 kHz zur inversen Transformationsschaltung 203 geliefert, und die Daten für das Band von 5,5 bis 11 kHz werden zur inversen Transformationsschaltung 204 geliefert, während die Daten für das Band von 11 bis 22 kHz zur inversen Transformationsschaltung 205 geliefert werden. Durch diese Schaltungen 203 bis 205 werden die Spektraldaten in Abhängigkeit von der oben erwähnten orthogonalen Blockgrößeninformation invers-orthogonal-transformiert.
  • Die Ausgangssignale der inversen orthogonalen Transformationsschaltungen 204 und 205 werden durch ein Band-Synthesizer-Filter 202 synthesizt, während die Ausgangssignale der inversen orthogonalen Transformationsschaltung 203 und des Synthesizer-Filters 202 durch ein Band-Syntheszing-Filter 201 künstlich hergestellt werden, so dass diese an einem Ausgangsanschluss 200 als Wiedergabesignale ausgegeben werden.
  • Die vorliegende Erfindung ist nicht auf die oben beschriebenen Ausführungsformen beschränkt. Beispielsweise können die beiden Aufzeichnungs-/Wiedergabeträger über ein Datenübertragungskabel miteinander verbunden werden, ohne dass es notwendig ist, zwei Träger zu haben, die in einem System eingebaut sind. Die vorliegende Erfindung kann nicht nur bei PCM-Audiosignalen angewandt werden, sondern auch bei digitalen Sprachsignalen oder digitalen Videosignalen. Der Aufbau der oben erwähnten Minimal-Hörbarkeitskurve kann auch weggelassen werden, wobei in diesem Fall die Minimal-Hörbarkeits-Kurvenerzeugungsschaltung 32 oder die Synthesizer-Schaltung 27 weggelassen werden kann und ein Ausgangssignal des Subtrahierers 24 unmittelbar zum Subtrahierer 28 übertragen werden kann, nach umgekehrter Faltung durch den Teiler 26. Zusätzlich kann eine breite Vielfalt von Bitzuteilungsverfahren verwendet werden, beispielsweise eine feste Bitzuteilung, eine Bitzuteilung auf der Basis von Bandsignalenergien oder eine Bitzuteilung, welche aus der Kombination einer festen Bitzuteilung und einer variablen Bitzuteilung besteht.
  • Es aus den obigen Ausführungen erkennt man, dass eine Vorrichtung und ein Verfahren bereitgestellt wird, um komprimierte Daten auf einem Aufzeichnungsträger aufzuzeichnen, wodurch es ermöglicht wird, zu verhindern, dass die Abtastfrequenz-Signalerzeugungsschaltung und folglich die Hardware bezüglich des Aufwands vergrößert wird, wobei die gleiche Abtastfrequenz verwendet wird, unabhängig vom Unterschied der Bitrate, die für unterschiedliche Modi geeignet ist.
  • Wenn mit der niedrigen Bitrate codiert wird ist es unter Verwendung der gleichen subsidiären Information für mehrere Blockgleitbänder, welche einander im Zeitbereich benachbart sind oder mehrere Blockgleitbändern, die einander längs des Frequenzbereichs benachbart sind, in einem und dem gleichen Zeitblock zum Aufzeichnen oder zur Übertragung und durch Ändern der Kombination der Blockgleitbänder für welche die subsidiäre Information allgemein verwendet wird, beispielsweise Änderungen in Abhängigkeit von der orthogonalen Transformationsblockgröße, möglich, das Volumen der subsidiären Information zu reduzieren, während der Effekt in Bezug auf die Quantisierung und die Codierwirksamkeit minimiert wird. Die somit eingesparte subsidiäre Information kann der Hauptinformation zugeteilt werden, um die Quantisierungs- und Codierwirksamkeit zu verbessern.
  • Wenn gewünscht wird, komprimierte Signale des Hochbitratenmodus in Signale des Niedrigratenmodus für eine Langzeitaufzeichnung umzusetzen, können die komprimierten Signale der Niedrigbitrate lediglich durch Datenumsetzung im Frequenzbereich erzeugt werden, ohne die Notwendigkeit, die ursprünglichen Frequenzbereichs-Kompressionssignale in entsprechende Zeitbereichssignale umzusetzen. Es kann eine Hochgeschwindigkeits-Signaltransformation erreicht werden, da auf den Prozess einer Orthogonal-Transformation, einer inversen Orthogonal-Transformation und eines Bandunterteilens und auf das Synthesizer-Filtern verzichtet werden kann.

Claims (64)

  1. Vorrichtung zum Aufzeichnen, Reproduzieren, Übertragen und/oder Empfangen komprimierter Daten, in denen digitale Audiosignale in Signalkomponenten mehrerer Frequenzbänder getrennt sind, um Signalkomponenten in mehreren zweidimensionalen Blöcken zu erzeugen, wobei die beiden Bemessungen Zeit und Frequenz sind, wobei die Signalkomponenten für jeden der zweidimensionalen Blöcke längs von Zeit und Frequenz quantisiert und komprimiert sind, um mit Informationskompressionsparametern für jeden der zweidimensionalen Blöcke aufgezeichnet oder übertragen zu werden, und/oder in denen die informations-komprimierten Signalkomponenten innerhalb eines jeden der zweidimensionalen Blöcke unter Verwendung der Informationskompressionsparameter für jeden der zweidimensionalen Blöcke reproduziert oder empfangen werden, wobei die Vorrichtung aufweist: eine Einrichtung zum Gruppieren (405, 406, 508, 509) – vor zumindest einem von Aufzeichnen, Übertragen, Reproduzieren oder Empfangen – der Informationskompressionsparameter für zumindest zwei der zweidimensionalen Blöcke, die einander benachbart sind, längs der Zeitbemessung oder längs der Frequenzbemessung, so dass die gleichen Informationskompressions-Parameterwerte für die zumindest beiden zweidimensionalen Blöcke gesetzt werden.
  2. Vorrichtung nach einem vorhergehenden Ansprüche, die mehrere Modi zum Aufzeichnen, Reproduzieren, Übertragen und/oder Empfangen der komprimierten Daten aufweist, wobei die mehreren Modi entsprechende unterschiedliche Informationsbitraten haben, wobei die Vorrichtung aufweist: eine Einrichtung (63, 57) zum Ändern der Anzahl von mehreren Informationsbitraten, wobei die Anzahl der Informationskompressionsparameter auf der Basis einer Informationsbitrate für einen ausgewählten Modus geändert wird.
  3. Vorrichtung nach Anspruch 2, welche außerdem eine Einrichtung (63, 57) aufweist, um die Anzahl von Informationskompressionsparametern als Antwort auf eine höhere Informationsbitrate für einen ausgewählten Modus zu erhöhen.
  4. Vorrichtung nach Anspruch 2, welche außerdem eine Einrichtung (63, 57) aufweist, um die Anzahl von Informationskompressionsparametern als Antwort auf eine niedrigere Informationsbitrate für einen ausgewählten Modus zu vermindern.
  5. Vorrichtung nach Anspruch 3 oder 4, welche außerdem eine Einrichtung (63, 57) aufweist, um die Anzahl der Informationskompressionsparameter proportional zu den Informationsbitraten für die ausgewählten Modi zu ändern.
  6. Vorrichtung nach Anspruch 5, wobei die Gruppiereinrichtung (405, 406, 508, 509) betriebsfähig ist, das Gruppieren durchzuführen, um eine Verminderung der Anzahl der Informationskompressionsparameter zu erreichen.
  7. Vorrichtung nach Anspruch 6, wobei die Gruppiereinrichtung (405, 406, 508, 509) betriebsfähig ist, die Informationskompressionsparameter, die bezüglich der Anzahl für diejenigen Modi größer werden, die eine niedrigere Informationsbitrate haben, zusammen zu gruppieren.
  8. Vorrichtung nach Anspruch 7, wobei die Gruppiereinrichtung (405, 406, 508, 509) betriebsfähig ist, um die Informationskompressionsparameter, die im umgekehrten Verhältnis zur Informationsbitrate für jeden Modus ansteigen, zusammen zu gruppieren.
  9. Vorrichtung nach Anspruch 8, welche außerdem eine Einrichtung (107) aufweist, um zumindest einen zweidimensionalen Block zu erzeugen, der zumindest einer von einem Blockgleitblock und einem Quantisierungsrauscherzeugungs-Unterdrückungsblock ist.
  10. Vorrichtung nach Anspruch 9, wobei die Eingangssignale Audiosignale sind, die außerdem eine Einrichtung (101, 102) aufweist, um die Frequenzbreite von zumindest einer Majorität der Quantisierungsrausch-Unterdrückungsblöcke so festzulegen, dass sie in Richtung höherer Frequenzen breiter wird.
  11. Vorrichtung nach Anspruch 10, welche außerdem eine Einrichtung (108) aufweist, um die gleiche Abtastfrequenz für alle Modi zu verwenden.
  12. Vorrichtung nach Anspruch 9, welche außerdem eine Orthogonal-Transformationseinrichtung (103, 104, 105) aufweist, um die Digitalsignale in mehrere Frequenzkomponenten zu unterteilen, um Signalkomponenten in mehreren der zweidimensionalen Blöcke zu erzeugen, und eine inverse Orthogonal-Transformationseinrichtung, um Signale in den zweidimensionalen Blöcken in Digitalsignale im Zeitbereich umzusetzen.
  13. Vorrichtung nach Anspruch 12, welche außerdem eine Einrichtung (101, 102) aufweist, um die Digitalsignale in mehrere Frequenzkomponenten zu unterteilen, wobei die mehreren Frequenzkomponenten in mehrere Bänder unterteilt sind, um Signalkomponenten in den zweidimensionalen Blöcken zu erzeugen, wobei jeder Block für jedes Band orthogonal-transformiert (103, 104, 105) wird, um Koeffizientendaten zu erzeugen, und eine Einrichtung, um Signale in den mehreren Bändern im Frequenzbereich in Signale im Zeitbereich durch inverse Orthogonal-Transformation (203, 204, 205) – für jedes der mehreren Bänder im Frequenzbereich – der Signale in jedem der mehreren Bänder umzusetzen, und eine Einrichtung, um diese invers-orthogonal-transformierten Signale in künstlich hergestellte Signale im Zeitbereich zu erzeugen.
  14. Vorrichtung nach Anspruch 12 oder 13, welche außerdem eine Einrichtung (106) aufweist, um die Blockbemessung von zumindest einer von der Orthogonal-Transformation oder der inversen Orthogonal-Transformation zu variieren.
  15. Vorrichtung nach Anspruch 13 oder 14, die außerdem eine Einrichtung (57) aufweist, um zumindest eines von der Frequenzbreite bei Teilung von Zeitbereichssignalen vor der Orthogonal-Transformation in mehrere Bänder im Frequenzbereich und der Frequenzbreite bei Synthese von mehreren Bändern im Frequenzbereich im Anschluss an die inverse Orthogonal-Transformation in Signale im Zeitbereich auszuwählen, damit diese für zwei aufeinanderfolgende Bänder im untersten Frequenzbereich gleich ist.
  16. Vorrichtung nach Anspruch 15, welche außerdem eine Einrichtung (105) aufweist, um die Frequenzbreite von Unterteilungen für zumindest eines von Zeitbereichssignalen vor der Orthogonal-Transformation in mehrere Bänder im Frequenzbereich und von künstlich hergestellten Zeitbereichssignalen im Anschluss an die inverse Orthogonal-Transformation in Signale im Zeitbereich auszuwählen, um in Richtung auf höhere Frequenzen breiter zu sein.
  17. Vorrichtung nach Anspruch 16, wobei die Orthogonal-Transformation eine modifizierte diskrete Kosinustransformation und die inverse Orthogonal-Transformation eine inverse modifizierte diskrete Kosinustransformation ist.
  18. Vorrichtung nach Anspruch 16, wobei die Einrichtung (106) zum Auswählen die Orthogonal-Transformations-Blockbemessung so auswählt, dass sie unter allen Modi die gleiche ist, die unterschiedliche Informationsbitraten haben.
  19. Vorrichtung nach Anspruch 18, welche außerdem eine Einrichtung (108) aufweist, um komprimierte Daten zwischen Modi umzusetzen, welche unterschiedliche Informationsbitraten haben, wobei eine solche Umsetzung in bezug auf Signalkomponenten im Frequenzbereich ausgeführt wird.
  20. Vorrichtung nach Anspruch 19, wobei die Einrichtung (505, 506, 507, 508) zum Umsetzen komprimierter Daten zwischen Modi, wenn komprimierte Daten von einem Modus, der eine höhere Informationsbitrate hat, in einen Modus, der eine niedrigere Informationsbitrate hat, modus-umgesetzt werden, die komprimierten Daten im Frequenzbereich umsetzt.
  21. Vorrichtung nach Anspruch 20, wobei die Einrichtung (509, 510) zum Umsetzen komprimierter Daten, wenn komprimiere Daten von einem Modus, der eine niedrigere Informationsbitrate hat, in einem Modus, der eine höhere Informationsbitrate hat, modus-umgesetzt werden, die komprimierten Daten in bezug auf codierte komprimierte Daten umsetzt.
  22. Vorrichtung nach einem der Ansprüche 1 bis 21, welche aufweist: eine Einrichtung (405, 406, 508, 509) zum Andern der Gruppierung von Informationskompressionsparametern auf der Basis von zumindest einem von mehreren Unterteilungsmodi in die zweidimensionalen Blöcke.
  23. Vorrichtung nach Anspruch 22, wobei die Einrichtung (405, 406, 508, 509) zum Ändern der Gruppierung die Gruppierung der Informationskompressionsparameter auf der Basis der Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs der Zeitbemessung ändert.
  24. Vorrichtung nach Anspruch 23, wobei die Einrichtung (405, 406, 508, 509) zum Ändern der Gruppierung die Gruppierung der Informationskompressionsparameter auf der Basis der Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs der Frequenzbemessung ändert.
  25. Vorrichtung nach Anspruch 23, wobei die Einrichtung zum Ändern der Gruppierung von Informationskompressionsparametern die Gruppierung der Informationskompressionsparameter auf der Basis der Anzahl von Unterteilungen in die zweidimensionalen Blöcke ändert.
  26. Vorrichtung nach Anspruch 23, 24 oder 25, wobei die Einrichtung zum Ändern der Gruppierung von Informationskompressionsparametern, wenn die Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs der Zeitbemessung eine Mehrzahl ist, die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die längs der Zeitbemessung aufgereiht sind, gruppiert.
  27. Vorrichtung nach Anspruch 26, wobei die Einrichtung (405, 406, 508, 509) zum Ändern der Gruppierung von Informationskompressionsparametern die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die längs der Zeitbemessung benachbart zueinander aufgereiht sind, gruppiert.
  28. Vorrichtung nach Anspruch 27, wobei die Einrichtung (405, 406, 508, 509) zum Ändern der Gruppierung von Informationskompressionsparametern die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die längs der Zeitbemessung und längs der Frequenzbemessung benachbart zueinander aufgereiht sind, gruppiert.
  29. Vorrichtung nach Anspruch 23, 24 oder 25, wobei die Einrichtung (405, 406, 508, 509) zum Ändern der Gruppierung von Informationskompressionsparametern, wenn die Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs von zumindest einer von der Zeitbemessung und der Frequenzbemessung eine Mehrzahl ist, die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die längs der Zeitbemessung und der längs der Frequenzbemessung benachbart zueinander aufgereiht sind, gruppiert.
  30. Vorrichtung nach Anspruch 23, 24 oder 25, wobei die Einrichtung (405, 406, 508, 509) zum Ändern der Gruppierung von Informationskompressionsparametern, wenn die Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs der Zeitbemessung null ist, die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die längs der Frequenzbemessung aufgereiht sind, gruppiert.
  31. Vorrichtung nach Anspruch 30, welche außerdem eine Einrichtung (405, 406, 508, 509) aufweist, um die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die benachbart zueinander längs der Frequenzbemessung aufgereiht sind, zu gruppieren.
  32. Vorrichtung nach Anspruch 23, 24 oder 25, wobei, wenn die zweidimensionalen Blöcke längs der Zeit und Frequenz lediglich durch Unterteilung längs des Frequenzbereichs gebildet werden, die Einrichtung (405, 406, 508, 509) zum Ändern der Gruppierung von Informationskompressionsparametern die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die längs der Frequenzbemessung aufgereiht sind, gruppiert.
  33. Vorrichtung nach Anspruch 32, wobei die Einrichtung (405, 406, 508, 509) zum Ändern der Gruppierung von Informationskompressionsparametern Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die benachbart zueinander längs der Frequenzbemessung aufgereiht sind, gruppiert.
  34. Verfahren zum Aufzeichnen, Wiedergeben, Übertragen und/oder Empfangen von komprimierten Daten, bei denen digitale Audiosignale in Signalkomponenten mehrerer Frequenzbänder unterteilt sind, um Signalkomponenten in mehreren zweidimensionalen Blöcken zu erzeugen, wobei die beiden Bemessungen Zeit und Frequenz sind, wobei die Signalkomponenten für jeden der zweidimensionalen Blöcke quantisiert und komprimiert werden, um so gemeinsam mit Informationskompressionsparametern für jeden der zweidimensionalen Blöcke aufgezeichnet und übertragen zu werden, und/oder wobei die informations-komprimierten Signalkomponenten innerhalb eines jeden der zweidimensionalen Blöcke unter Verwendung der Informationskompressionsparameter für jeden der zweidimensionalen Blöcke reproduziert oder empfangen werden, wobei das Verfahren folgenden Schritt aufweist: Gruppieren – vor zumindest einem von Aufzeichnen, Übertragen, Reproduzieren oder Empfangen – der Informationskompressionsparameter für zumindest zwei der zweidimensionalen Blöcke, die zueinander benachbart sind, längs der Zeitbemessung oder längs der Frequenzbemessung, so dass die gleichen Informationskompressionsparameterwerte für die zumindest beiden zweidimensionalen Blöcke gesetzt werden.
  35. Verfahren nach Anspruch 34, wobei das Verfahren folgenden Schritt aufweist: Ändern der Anzahl der Informationskompressionsparameter auf der Basis der Informationsbitraten für einen ausgewählten Modus, wobei der ausgewählte Modus zumindest einer von Aufzeichnen, Reproduzieren, Übertragen und Empfangen ist.
  36. Verfahren nach Anspruch 35, welches außerdem den Schritt aufweist, die Anzahl der Informationskompressionsparameter als Antwort auf eine vergrößerte Informationsbitrate für einen ausgewählten Modus zu steigern.
  37. Verfahren nach Anspruch 35, welches außerdem den Schritt aufweist, die Anzahl von Informationskompressionsparametern als Antwort auf eine niedrigere Informationsbitrate für einen ausgewählten Modus zu vermindern.
  38. Verfahren nach Anspruch 36 oder 37, welches außerdem den Schritt aufweist, die Anzahl der Informationskompressionsparameter proportional zu den Informationsbitraten für jeden ausgewählten Modus zu ändern.
  39. Verfahren nach Anspruch 38, wobei der Gruppierungsschritt eine Reduktion der Anzahl der Informationskompressionsparameter erzielt.
  40. Verfahren nach Anspruch 39, wobei der Gruppierungsschritt das Zusammengruppieren der Informationskompressionsparameter aufweist, die bezüglich der Anzahl für den Modus größer werden, der eine niedrigere Informationsbitrate hat.
  41. Verfahren nach Anspruch 40, wobei der Gruppierungsschritt das Zusammengruppieren der Informationskompressionsparameter aufweist, die bezüglich der Anzahl für den Modus größer werden, der eine niedrigere Informationsbitrate umgekehrt proportional zur Informationsbitrate für diesen Modus hat.
  42. Verfahren nach Anspruch 41, wobei der zweidimensionale Block zumindest einer von einem Blockgleitblock und einem Quantisierrauscherzeugungs-Unterdrückungsblock ist.
  43. Verfahren nach Anspruch 42, wobei Eingangssignale Audiosignale sind, welches außerdem den Schritt aufweist, die Frequenzbreite von zumindest der Majorität der Quantisierungsrauscherzeugungs-Unterdrückungsblöcke so festzulegen, dass diese in Richtung auf höhere Frequenzen breiter wird.
  44. Verfahren nach Anspruch 43, welches außerdem den Schritt aufweist, die gleiche Abtastfrequenz für alle Modi zu verwenden.
  45. Verfahren nach Anspruch 44, welches außerdem die Schritte zum Nutzen einer Orthogonal-Transformation aufweist, um die Digitalsignale in mehrere Frequenzkomponenten zu unterteilen, um Signalkomponenten in mehreren zweidimensionalen Blöcken längs der Zeit und Frequenz zu erzeugen, und eine inverse Orthogonal-Transformation zu nutzen, um Signale in den zweidimensionalen Blöcken längs der Zeit und der Frequenz in Digitalsignale im Zeitbereich umzusetzen.
  46. Verfahren nach Anspruch 45, welches außerdem die Schritte aufweist, den Frequenzbereich in mehrere Bänder zu unterteilen, wobei in jedem davon Blöcke gebildet werden, wobei jeder Block aus mehreren Abtastungen besteht, orthogonales Transformieren jedes der mehreren Bänder, um Koeffizientendaten zu erzeugen, um dadurch Signalkomponenten in den zweidimensionalen Blöcken zu erzeugen, und Signale in den mehreren Bändern im Frequenzbereich in Signale im Zeitbereich durch inverses orthogonales Transformieren von Signalen innerhalb jedes der mehreren Bänder umzusetzen und um die inversen orthogonal-transformierten Signale künstlich herzustellen, um Signale im Zeitbereich zu erzeugen.
  47. Verfahren nach Anspruch 45 oder 46, welches außerdem den Schritt aufweist, die Blockbemessung von zumindest einem von der Orthogonal-Transformation und der inversen Orthogonal-Transformation festzulegen, variabel zu sein.
  48. Verfahren nach Anspruch 46 oder 47, welches außerdem den Schritt aufweist, die Frequenzbreite der mehreren Bänder so auszuwählen, dass sie für zwei aufeinanderfolgende Bänder im untersten Frequenzbereich die gleiche ist.
  49. Verfahren nach Anspruch 48, welches außerdem den Schritt aufweist, die Frequenzbreite so auszuwählen, dass sie in Richtung auf die höheren Frequenzen breiter wird.
  50. Verfahren nach Anspruch 49, wobei eine modifizierte diskrete Kosinustransformation als Orthogonal-Transformation verwendet wird, und eine inverse modifizierte diskrete Kosinustransformation als inverse Orthogonal-Transformation verwendet wird.
  51. Verfahren nach Anspruch 49, welches außerdem den Schritt aufweist, die Orthogonal-Transformations-Blockbemessung so auszuwählen, dass sie unter allen Modi, die unterschiedliche Informationsbitraten haben, die gleiche ist.
  52. Verfahren nach Anspruch 51, wobei, wenn komprimierte Daten zwischen den Modi, die unterschiedliche Informationsbitraten haben, umgesetzt werden, diese Umsetzung der komprimierten Daten in bezug auf die Signalkomponenten im Frequenzbereich ausgeführt wird.
  53. Verfahren nach Anspruch 52, wobei, wenn komprimierte Daten von einem Modus, der eine höhere Informationsbitrate hat, in einem Modus, der eine niedrigere Informationsbitrate hat, modus-umgesetzt-werden, die Umsetzung der komprimierten Daten in bezug auf die Signalkomponenten im Frequenzbereich durchgeführt wird.
  54. Verfahren nach Anspruch 53, wobei, wenn komprimierte Daten von einem Modus, der einen niedrigere Informationsbitrate hat, in einem Modus, der eine höhere Infor mationsbitrate hat, modus-umgesetzt-werden, die Umsetzung der komprimierten Daten in Bezug auf codierte komprimierte Daten ausgeführt wird.
  55. Verfahren nach einem der Ansprüche 34 bis 54, welches folgenden Schritt aufweist: Ändern der Gruppierung von Informationskompressionsparametern der zweidimensionalen Blöcke längs der Zeit und Frequenz auf der Basis einer Auswahl von zumindest einem von mehreren Unterteilungsmodi in die zweidimensionalen Blöcke für zumindest eines von einer Aufzeichnung, Übertragung, Wiedergabe und Empfang.
  56. Verfahren nach Anspruch 55, wobei der Schritt zum Ändern der Gruppierung von Informationskompressionsparametern auf der Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs der Zeitbemessung basiert.
  57. Verfahren nach Anspruch 55, wobei die Art und Weise des Gruppierens der Informationskompressionsparameter auf der Basis der Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs der Frequenzbemessung geändert wird.
  58. Verfahren nach Anspruch 55, wobei die Art und Weise des Gruppierens der Informationskompressionsparameter auf der Basis der Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs der Frequenzbemessung und der Zeitbemessung geändert wird.
  59. Verfahren nach Anspruch 56, 57 oder 58, wobei, wenn die Anzahl von Unterteilungen in die zweidimensionalen Blöcken längs der Zeitbemessung eine Mehrzahl ist, die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, welche längs der Zeitbemessung aufgereiht sind, gruppiert werden.
  60. Verfahren nach Anspruch 59, wobei die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die benachbart zueinander längs der Zeitbemessung aufgereiht sind, gruppiert werden.
  61. Verfahren nach Anspruch 60, wobei die Informationskompressionsparameter von mehreren zweidimensionalen Blöcken, die benachbart zueinander längs der Zeitbemessung und längs der Frequenzbemessung aufgereiht sind, gruppiert werden.
  62. Verfahren nach Anspruch 56, 57 oder 58, wobei, wenn die Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs der Zeitbemessung und/oder der Frequenz-Bemessung eine Mehrzahl ist, die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die benachbart zueinander längs der Zeitbemessung und längs der Frequenzbemessung aufgereiht sind, gruppiert werden.
  63. Verfahren nach Anspruch 56, 57 oder 58, wobei, wenn die Anzahl von Unterteilungen in die zweidimensionalen Blöcke längs des Zeitmassstabs null sind, die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, die längs der Frequenzbemessung aufgereiht sind, gruppiert werden.
  64. Verfahren nach Anspruch 56, 57 oder 58, wobei, wenn die zweidimensionalen Blöcke längs der Zeit und Frequenz lediglich durch Unterteilen des Frequenzbereichs gebildet sind, die Informationskompressionsparameter von mehreren der zweidimensionalen Blöcke, welche längs der Frequenz ausgereiht sind, gruppiert werden.
DE69434225T 1993-03-09 1994-03-09 Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger Expired - Lifetime DE69434225T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP4794393 1993-03-09
JP05047943A JP3123290B2 (ja) 1993-03-09 1993-03-09 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体

Publications (2)

Publication Number Publication Date
DE69434225D1 DE69434225D1 (de) 2005-02-17
DE69434225T2 true DE69434225T2 (de) 2005-12-08

Family

ID=12789453

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69434225T Expired - Lifetime DE69434225T2 (de) 1993-03-09 1994-03-09 Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger

Country Status (9)

Country Link
US (1) US5548574A (de)
EP (3) EP1517324B1 (de)
JP (1) JP3123290B2 (de)
KR (1) KR100361954B1 (de)
CN (1) CN1132317C (de)
AT (1) ATE287148T1 (de)
AU (1) AU676873B2 (de)
DE (1) DE69434225T2 (de)
TW (1) TW279975B (de)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03139700A (ja) * 1989-10-25 1991-06-13 Sony Corp オーディオ信号再生装置
US6695477B1 (en) * 1989-10-25 2004-02-24 Sony Corporation Audio signal reproducing apparatus
US6002536A (en) * 1990-07-06 1999-12-14 Hitachi Ltd. Digital transmission signal processing system and recording/reproducing system
US5930758A (en) * 1990-10-22 1999-07-27 Sony Corporation Audio signal reproducing apparatus with semiconductor memory storing coded digital audio data and including a headphone unit
TW272341B (de) * 1993-07-16 1996-03-11 Sony Co Ltd
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JP3277679B2 (ja) * 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
US5893065A (en) * 1994-08-05 1999-04-06 Nippon Steel Corporation Apparatus for compressing audio data
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
EP0724250B1 (de) * 1994-12-02 2003-06-25 Sony Computer Entertainment Inc. Verfahren zur erzeugung von tonquellendaten, aufzeichnungsmedium und prozessor für solche daten.
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
US5779685A (en) * 1995-11-13 1998-07-14 Quest Medical, Inc. Retrograde cardioplegia catheter and method of use
US6049517A (en) * 1996-04-30 2000-04-11 Sony Corporation Dual format audio signal compression
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
JPH10187199A (ja) * 1996-12-24 1998-07-14 Oki Electric Ind Co Ltd 半導体記憶媒体記録装置及び半導体記憶媒体再生装置
US6014491A (en) * 1997-03-04 2000-01-11 Parsec Sight/Sound, Inc. Method and system for manipulation of audio or video signals
US6721491B1 (en) * 1999-12-22 2004-04-13 Sightsound Technologies, Inc. Method and system for manipulation of audio or video signals
US6009372A (en) * 1997-10-01 1999-12-28 Cummins Engine Company, Inc. Management of programming and memory space for an internal combustion engine control system
US5978757A (en) * 1997-10-02 1999-11-02 Lucent Technologies, Inc. Post storage message compaction
US6353807B1 (en) * 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
US6298071B1 (en) * 1998-09-03 2001-10-02 Diva Systems Corporation Method and apparatus for processing variable bit rate information in an information distribution system
JP3594514B2 (ja) * 1999-07-12 2004-12-02 株式会社ソニー・コンピュータエンタテインメント エンコーダ、デコーダ、音声データ処理装置、音声データ処理システム、音声データ圧縮方法、音声データ伸張方法、音声データ処理方法及び記録媒体
US6567781B1 (en) 1999-12-30 2003-05-20 Quikcat.Com, Inc. Method and apparatus for compressing audio data using a dynamical system having a multi-state dynamical rule set and associated transform basis function
US7827112B2 (en) * 2001-03-01 2010-11-02 Sony Corporation Digital signal processing apparatus, digital signal processing method, information center, and data delivery system
JP2006018023A (ja) * 2004-07-01 2006-01-19 Fujitsu Ltd オーディオ信号符号化装置、および符号化プログラム
EP2186087B1 (de) * 2007-08-27 2011-11-30 Telefonaktiebolaget L M Ericsson (PUBL) Verbesserte transformationskodierung von sprach- und audiosignalen
US9349196B2 (en) 2013-08-09 2016-05-24 Red Hat, Inc. Merging and splitting data blocks
CN105323012B (zh) * 2014-07-14 2019-07-02 宏碁股份有限公司 声音数据传输系统与声音数据传输方法

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
JPS61107818A (ja) * 1984-10-30 1986-05-26 Nec Corp エントロピ−符号化方式とその装置
JPH0734291B2 (ja) * 1986-07-28 1995-04-12 株式会社日立製作所 デイジタル信号記録再生システム
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
EP0370277A3 (de) * 1988-11-24 1991-09-18 Siemens Aktiengesellschaft Subband-Übertragungssystem
KR100220861B1 (ko) * 1989-01-27 1999-09-15 쥬더, 에드 에이. 고품질 오디오용 낮은 시지연 변환인코더, 디코더 및 인코딩/디코딩방법
DE69026278T3 (de) * 1989-01-27 2002-08-08 Dolby Lab Licensing Corp Adaptiv Bitzuordnung für Audio-Koder und Dekoder
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
DE69031517T2 (de) * 1989-06-30 1998-02-26 Nippon Electric Co Variable Blocklängenkodierung für unterschiedliche Charakteristiken der Eingangsabtastwerte
JP2844695B2 (ja) * 1989-07-19 1999-01-06 ソニー株式会社 信号符号化装置
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
FR2653280B1 (fr) * 1989-10-13 1992-01-10 France Etat Dispositif d'allocation de bits pour signal audio-numerique transforme, a quantification adaptative sur critere psycho-auditif.
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
CA2032765C (en) * 1989-12-21 1995-12-12 Hidetaka Yoshikawa Variable rate encoding and communicating apparatus
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置
JP3185214B2 (ja) * 1990-06-12 2001-07-09 日本電気株式会社 改良dctの順変換計算装置および逆変換計算装置
JP3192136B2 (ja) * 1990-07-19 2001-07-23 株式会社東芝 ディスク装置
JP3033156B2 (ja) * 1990-08-24 2000-04-17 ソニー株式会社 ディジタル信号符号化装置
US5244705A (en) * 1990-08-24 1993-09-14 Sony Corporation Disc-shaped recording medium
JP3141241B2 (ja) * 1990-08-24 2001-03-05 ソニー株式会社 ディスク記録装置及びディスク再生装置
US5334977A (en) * 1991-03-08 1994-08-02 Nec Corporation ADPCM transcoder wherein different bit numbers are used in code conversion
RU2090973C1 (ru) * 1991-03-29 1997-09-20 Сони Корпорейшн Способ кодирования сигналов
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
JP3134338B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
KR100268623B1 (ko) 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
DE4225434A1 (de) 1991-08-02 1993-02-04 Sony Corp Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
JP3198550B2 (ja) * 1991-09-03 2001-08-13 ソニー株式会社 圧縮データ記録方法及び圧縮データ記録再生装置
JP3158556B2 (ja) * 1991-09-27 2001-04-23 ソニー株式会社 ディスク記録装置及びディスク再生装置
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置

Also Published As

Publication number Publication date
EP1517324A2 (de) 2005-03-23
AU5641694A (en) 1994-09-15
JP3123290B2 (ja) 2001-01-09
EP0615349A2 (de) 1994-09-14
EP1517324A3 (de) 2008-05-07
EP2391030B1 (de) 2015-08-19
AU676873B2 (en) 1997-03-27
DE69434225D1 (de) 2005-02-17
EP2391030A1 (de) 2011-11-30
EP0615349B1 (de) 2005-01-12
KR100361954B1 (ko) 2003-02-07
ATE287148T1 (de) 2005-01-15
US5548574A (en) 1996-08-20
CN1132317C (zh) 2003-12-24
CN1100850A (zh) 1995-03-29
TW279975B (de) 1996-07-01
JPH0730432A (ja) 1995-01-31
EP0615349A3 (de) 1998-06-03
EP1517324B1 (de) 2013-05-15
KR940023043A (ko) 1994-10-22

Similar Documents

Publication Publication Date Title
DE69434225T2 (de) Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger
DE4221321B4 (de) Schaltungsanordnung zur Aufzeichnung und/oder Wiedergabe von komprimierten Daten sowie Signalverarbeitungsverfahren
EP0636268B1 (de) Gerät, verfahren und system zur komprimierung eines digitalen eingangssignals in mehr als einem kompressionsmodus
DE69837738T2 (de) Dekodierverfahren und -gerät
DE4225434A1 (de) Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
DE69829242T2 (de) Tonsignalkodierverfahren und -gerät
DE69210689T2 (de) Kodierer/dekodierer für mehrdimensionale schallfelder
US5590108A (en) Encoding method and apparatus for bit compressing digital audio signals and recording medium having encoded audio signals recorded thereon by the encoding method
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE69737302T2 (de) Verfahren zum Codieren von digitalen Audiosignalen
US5621856A (en) Digital encoder with dynamic quantization bit allocation
DE69006011T3 (de) Transformationscodierer, -decodierer und -codierer/decodierer mit niedriger bitrate für audio-anwendungen hoher qualität.
EP0720307A2 (de) Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals
DE60020663T2 (de) Verfahren zur Formatierung eines Audiodatenstroms
KR100391762B1 (ko) 압축데이터기록장치및압축데이터기록방법과압축데이터재생방법
EP0691751B1 (de) Verfahren und vorrichtung zur informationskompression und vorrichtung zum aufnehmen/übertragen komprimierter informationen
DE4447257A1 (de) Verfahren und Vorrichtung zum Codieren eines digitalen Tonsignals
US5642383A (en) Audio data coding method and audio data coding apparatus
JPH08162964A (ja) 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
JPH07168593A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに信号記録媒体
JP3531178B2 (ja) ディジタル信号処理装置及び方法
JP3334374B2 (ja) ディジタル信号圧縮方法及び装置
JPH08181619A (ja) ディジタル信号圧縮方法及び装置、並びに記録媒体
JPH06324093A (ja) オーディオ信号のスペクトル表示装置
JP3334375B2 (ja) ディジタル信号圧縮方法及び装置

Legal Events

Date Code Title Description
8364 No opposition during term of opposition