DE69732870T2 - System zur Kodierung und Dekodierung von Audiosignalen - Google Patents

System zur Kodierung und Dekodierung von Audiosignalen Download PDF

Info

Publication number
DE69732870T2
DE69732870T2 DE69732870T DE69732870T DE69732870T2 DE 69732870 T2 DE69732870 T2 DE 69732870T2 DE 69732870 T DE69732870 T DE 69732870T DE 69732870 T DE69732870 T DE 69732870T DE 69732870 T2 DE69732870 T2 DE 69732870T2
Authority
DE
Germany
Prior art keywords
section
frequency domain
quantization
domain signals
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69732870T
Other languages
English (en)
Other versions
DE69732870D1 (de
Inventor
Masahiro Minato-ku Iwadare
Yuichiro Minato-ku Takamizawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of DE69732870D1 publication Critical patent/DE69732870D1/de
Application granted granted Critical
Publication of DE69732870T2 publication Critical patent/DE69732870T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Hintergrund der Erfindung
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf ein System zum effektiven Codieren und Decodieren eines Sprachsignals, eines Audiosignals usw.
  • 2. Beschreibung des Stands der Technik
  • In einem digitalen Codiersystem für ein Sprachsignal, für ein Audiosignal usw. wird die Signalübertragungsrate oder -aufzeichnungsrate verringert, wenn seine Redundanz entfernt wird. Als eine Referenz des Stands der Technik wird anhand der 3 und 4 ein Codiersystem beschrieben, das in ISO/IEC (International Organisation for Standardisation/International Electro-technical Commission) 11172-3 (als MPEG/Audio bezeichnet), Schicht I, definiert ist.
  • Ein in 3 gezeigter herkömmlicher Codierer ist aus einem Eingabeanschluss 1, einem Signalkonvertierungsabschnitt 2, einem Analysierabschnitt 3, einem Auswahlabschnitt 4, Quantisierungsabschnitten 51 bis 53, einem Multiplexabschnitt 6 und einem Ausgabeanschluss 7 gebildet. Die Quantisierungsabschnitte 51 bis 53 unterscheiden sich voneinander in Bezug auf die Anzahl der Quantisierungsschritte. In diesem Beispiel besitzt der Quantisierungsabschnitt 51 drei Quantisierungsschritte. Der Quantisierungsabschnitt 52 besitzt sieben Quantisierungsschritte. Der Quantisierungsabschnitt 53 besitzt 15 Quantisierungsschritte. In dem Literaturhinweis des verwandten Gebiets sind Quantisierungsabschnitte mit mehr als 15 Schritten vorgesehen, wobei sie aber in diesem Dokument zur Vereinfachung weggelassen sind.
  • Dieses System basiert auf einem Teilbandcodiersystem, bei dem ein Eingabesignal in eine Vielzahl von Frequenzdomänensignalen unterteilt wird und jedes Frequenzdomänensignal unabhängig codiert wird. Allgemein haben Sprach- und Audiosignale bei niedrigerer Frequenz höhere Amplituden, wobei die erforderliche Rate zur Übertragung dadurch verringert werden kann, dass bei niedrigerer Frequenz mehr Bits zugewiesen werden, während bei höherer Frequenz weniger Bits zugewiesen werden.
  • In der Realität wird von dem Eingabeanschluss 1 ein digitales Audiosignal, z. B. PCM-Audioabtastwerte, geliefert. Jedes Mal, wenn 32 Abtastwerte des Audiosignals eingegeben werden, unterteilt der Signalkonvertierungsabschnitt 2 die Frequenzbänder des Eingabeaudiosignals und konvertiert sie in 32 Frequenzdomänensignale. Außerdem speichert der Signalkonvertierungsabschnitt 2 12 Sätze von Frequenzdomänensignalen in einem Puffer davon, da die durch eine Konversion erhaltenen 32 Frequenzdomänensignale ein Satz von Frequenzdomänensignalen ist. Die 12 Sätze von Frequenzdomänensignalen mit der gleichen Frequenz werden als ein Block bezeichnet (32 × 12 = 384 Abtastwerte/Rahmen).
  • Der Analysierabschnitt 3 berechnet in jedem Frequenzband einen erlaubten Fehler beim Quantisieren der Frequenzdomänensignale. Wenn z. B. beim Bewerten der Codierungsqualität ein objektives S/N-Verhältnis verwendet wird, wird der erlaubte Fehler für jedes Frequenzdomänensignal konstant gehalten. Wenn ein Audiosignal codiert wird, wird nicht nur ein objektiver Wert wie etwa das S/N-Verhältnis, sondern eine subjektive Bewertung wie etwa durch Testhören stark beachtet. Somit kann das Codierungsrauschen unter Verwendung psychoakustischer Analysetechnologien gesteuert werden, so dass die Verschlechterung der Hörqualität des wiedergegebenen Klangs minimiert wird. Folglich sollte basierend auf dem Eingabeaudiosignal und/oder den Frequenzdomänensignalen der erlaubte Fehler erhalten werden.
  • Der Auswahlabschnitt 4 wählt einen der Quantisierungsabschnitte 51 bis 53 aus, der die Frequenzdomänensignale für jeden Block quantisiert.
  • Jeder der Quantisierungsabschnitte 51 bis 53 empfängt einen Block von Frequenzdomänensignalen, berechnet die Amplitudeninformationen der Frequenzdomänensignale jedes Blocks, codiert die Frequenzdomänensignale mit den Amplitudeninformationen und gibt die Amplitudeninformationen und die Codes der codierten Frequenzdomänensignale aus. Die Amplitudeninformationen werden wie in Tabelle 1 gezeigt mit einer Genauigkeit von 2 dB erhalten.
  • [Tabelle 1] Beziehung zwischen Index und Amplitude
    Figure 00030001
  • In der Realität erfasst jeder der Quantisierungsabschnitte 51 bis 53 den maximalen Amplitudenabsolutwert der Frequenzdomänensignale in jedem Block und behandelt den aufgerundeten Wert mit der Genauigkeit von 2 dB als Amplitudeninformationen. In diesem Standard werden 63 Amplitudeninformationsindizes bereitgestellt. Um die Amplitudeninformationen zu senden, sind sechs Bits erforderlich.
  • In diesem Standard ist die Quantisierungscharakteristik linear. Unter der Annahme, dass der Betragswert eines Frequenzdomänensignals C ist, der Wert der Amplitudeninformationen L ist und die Anzahl der Quantisierungsschritte S ist, wobei die Koeffizienten A und B die Anzahl der Quantisierungsschritte S in Tabelle 2 entsprechen, wird [{A × (C/L) + B} × (S + 1)/2]berechnet. Die Bruchteile nach dem Dezimalkomma des berechneten Ergebnisses werden aufgerundet und die signifikanten höherwertigen N Bits erhalten. Anschließend wird durch Invertieren des höchstwertigen Bits der N Bits ein Code des Frequenzdomänensignals erhalten.
  • [Tabelle 2] Beziehung zwischen der Anzahl der Quantisierungsschritte S, den Koeffizienten A und B und den Bits N
    Figure 00040001
  • In einem Dequantisierungsabschnitt einer in 4 gezeigten Decodiervorrichtung wird das höchstwertige Bit des Codes invertiert und ein Ergebnis Q erhalten. Durch Berechnen von [{2 × (Q + 1)/S} × L] kann ein dequantisiertes Signal des Frequenzdomänensignals erhalten werden.
  • Nachfolgend werden reale Quantisierungs- und Dequantisierungsprozesse in dem Fall beschrieben, dass die Amplitudenwerte der Frequenzdomänensignale eines Blocks 0,10, –0,15, –0,03, 0,20, 0,05, 0,44, 0,05, –0,11, 0,32, –0,40, 0,92 und 0,04 sind.
  • Da der maximale Amplitudenwert in diesem Block 0,92 ist, wird als der Amplitudenwert 1,0 (Index = 3) ausgewählt. Entsprechend der oben beschriebenen Berechnung sind die in dem 15-Schritt-Quantisierungsprozess erhaltenen Codes 8, 6, 7, 9, 7, 10, 7, 6, 9, 4, 14 und 7. Der Dequantisierungsabschnitt dequantisiert diese Codes und erhält 0,133, –0,133, 0,0, 0,267, 0,0, 0,4, 0,0, –0,133, 0,267, –0,400, 0, 933 und 0, 0.
  • Die 15-Schritt-Quantisierungseinheit 53 benötigt zum Senden eines Codes eines Frequenzdomänensignals vier Bits. Somit benötigt die 15-Schritt-Quantisierungseinheit 53 zum Senden der Codes von 12 Frequenzdomänensignalen eines Blocks 48 Bits. Außerdem benötigt die 15-Schritt-Quantisierungseinheit 53 zum Senden der Amplitudeninformationen sechs Bits. Somit benötigt die 15-Schritt-Quantisierungseinheit 53 insgesamt 54 Bits.
  • Wenn der Quantisierungsabschnitt-Auswahlabschnitt 4 die Drei-Schritt-Quantisierungsabschnitte auswählt, werden die Codes 1, 1, 1, 1, 1, 2, 1, 1, 1, 0, 2 und 1 erhalten. Die dequantisierten Werte sind 0,0, 0,0, 0,0, 0,0, 0,0, 0,667, 0,0, 0,0, 0,0, –0,667, 0,667 und 0,0.
  • Somit ist die Gesamtzahl der zum Senden eines Blocks erforderlichen Bits insgesamt 30 Bits, die aus 12 Zwei-Bit-Codes, von denen jeder einen auf drei Niveaus quantisierten Wert jedes Frequenzdomänensignals repräsentiert, und sechs Bits, die die Amplitudeninformationen des Blocks repräsentieren, gebildet sind.
  • Wie bei der Dequantisierungsberechnung ist der Betrag des Quantisierungsfehlers proportional zu {(Amplitudenwert L)/(Anzahl der Quantisierungsschritte S)} jedes Blocks. Somit kann die Quantisierungsgenauigkeit der Frequenzdomänensignale verbessert werden, während die Anzahl der Quantisierungsschritte S groß ist. Allerdings wird die Anzahl der Bits N, die jeden Code repräsentieren, groß, wenn die Anzahl der Quantisierungsschritte S groß wird. Somit steigt die Übertragungsrate. Während der Quantisierungsabschnitt-Auswahlabschnitt 4 den Betrag des Quantisierungsfehlers jedes Frequenzdomänensignals in der Weise einstellt, dass er proportional zu dem durch den Analysierabschnitt 3 definierten erlaubten Fehler ist, wählt folglich der Quantisierungsabschnitt-Auswahlabschnitt 4 einen Quantisierungsabschnitt in der Weise aus, dass die Anzahl der zum Codieren aller Frequenzdomänensignale erforderlichen Bits in einer Domäne liegt, die der Übertragungsrate entspricht.
  • Der Multiplexabschnitt 6 multiplexiert die Quantisierungsabschnitt-Auswahlinformationen und eine Ausgabe eines Quantisierungsabschnitts für jeden Block, bildet einen Bitstrom und liefert ihn über den Ausgabeanschluss 7.
  • Die herkömmliche Decodiervorrichtung ist aus einem Eingabeanschluss 11, einem Demultiplexierungsabschnitt 12, einem Drei-Schritt-Dequantisierungsabschnitt 81, einem Sieben-Schritt-Dequantisierungsabschnitt 82, einem 15-Schritt-Dequantisierungsabschnitt 83, einem Abschnitt 13 für inverse Signalkonvertierung und einem Ausgabeanschluss 14 gebildet.
  • Die Decodiervorrichtung empfängt von dem Eingabeanschluss 11 ein multiplexiertes Signal. Der Demultiplexierungsabschnitt 12 demultiplexiert das multiplexierte Signal in Quantisierungsabschnitt-Auswahlinformationen und in eine Ausgabe eines Quantisierungsabschnitts. Mit den Quantisierungsabschnitt-Auswahlinformationen wird aus dem Drei-Schritt-Dequantisierungsabschnitt 81, aus dem Sieben-Schritt-Dequantisierungsabschnitt 82 und aus dem 15-Schritt-Dequantisierungsabschnitt 83 ein Dequantisierungsabschnitt ausgewählt, der dem Quantisie rungsverfahren auf der Codierungsseite entspricht. Jeder der Dequantisierungsabschnitte 81 bis 83 trennt die Ausgabe eines Quantisierungsabschnitts in Amplitudeninformationen und Codes der Frequenzdomänensignale. Wie oben beschrieben wurde, werden die Codes der Frequenzdomänensignale mit den Amplitudeninformationen dequantisiert und die Frequenzdomänensignale jedes Blocks reproduziert. Der Abschnitt 13 für inverse Signalkonvertierung konvertiert die Frequenzdomänensignale invers in ein Zeitdomänensignal und liefert das resultierende Signal über den Ausgabeanschluss 14.
  • In der Referenz des Stands der Technik wird ein Quantisierungsabschnitt verwendet, der mit einem Block gemeinsam ist. Somit wird die Verteilung der quantisierten Codes unregelmäßig, wobei sich die Codierungseffizienz verschlechtert, wenn die Amplitudenverteilung der Frequenzdomänensignale nicht gleich ist, wenn z. B. wenige Frequenzdomänensignale in dem Block große hervorstehende Amplituden haben.
  • Zusammenfassung der Erfindung
  • Eine Aufgabe der vorliegenden Erfindung ist die Schaffung eines Systems zum Konvertieren eines Schall- und Sprachsignals in Frequenzdomänensignale zum Bilden von Blöcken und zum Unterdrücken der Anzahl der Quantisierungsbits, um eine hohe Codierungsqualität zu erreichen, falls wenige Frequenzdomänensignale in den Blöcken hervorstehende Amplituden haben.
  • Die vorliegende Erfindung ist ein Codiersystem, wie es in Anspruch 1 definiert ist.
  • In dem Codiersystem gemäß der vorliegenden Erfindung sind die Ausgaben des zweiten Quantisierungsabschnitts eine Amplitudeninformationen, ein Polaritätscode und ein Index.
  • In dem Codiersystem gemäß der vorliegenden Erfindung sind die Ausgaben des zweiten Quantisierungsabschnitts eine repräsentative Amplitudeninformation, eine Vielzahl von Frequenzindizes und eine Vielzahl von Polaritätscodes.
  • In dem Codiersystem gemäß der vorliegenden Erfindung werden die Signalindizes bei der Bestimmung eines Teils der Frequenzdomänensignale des in dem zweiten Quantisierungsabschnitt zu codierenden Blocks zuvor in Gruppen unterteilt, wobei aus jeder der Gruppen nur ein Index auswählbar ist.
  • Außerdem ist die vorliegende Erfindung ein Decodiersystem, wie es in Anspruch 6 definiert ist.
  • In dem Decodiersystem gemäß der vorliegenden Erfindung sind die Eingaben des zweiten Dequantisierungsabschnitts Amplitudeninformationen, ein Polaritätscode und ein Index.
  • In dem Decodiersystem gemäß der vorliegenden Erfindung sind die Eingaben des zweiten Dequantisierungsabschnitts eine repräsentative Amplitudeninformation, eine Vielzahl von Frequenzindizes und eine Vielzahl von Polaritätscodes.
  • In dem Decodiersystem gemäß der vorliegenden Erfindung werden die Signalindizes zuvor durch den zweiten Dequantisierungsabschnitt dividiert, wobei nur ein Index in jeder der Gruppen eines Frequenzdomänensignals decodiert werden kann.
  • Frequenzdomänensignale mit großen hervorstehenden Amplituden werden mit Amplitudeninformationen, Polaritätsinformationen und Signalindex quantisiert/dequantisiert.
  • Diese und weitere Aufgaben, Merkmale und Vorteile der vorliegenden Erfindung werden im Licht der folgenden ausführlichen Beschreibung einer besten Ausführungsart davon, wie sie in der beigefügten Zeichnung gezeigt ist, besser sichtbar.
  • Kurzbeschreibung der Zeichnung
  • 1 ist ein Blockschaltplan, der ein Codiersystem gemäß der vorliegenden Erfindung zeigt;
  • 2 ist ein Blockschaltplan, der ein Decodiersystem gemäß der vorliegenden Erfindung zeigt;
  • 3 ist ein Blockschaltplan, der ein herkömmliches Codiersystem zeigt; und
  • 4 ist ein Blockschaltplan, der ein herkömmliches Decodiersystem zeigt.
  • Beschreibung einer bevorzugten Ausführungsform
  • Anhand der 1 und 2 wird eine Ausführungsform der vorliegenden Erfindung beschrieben. In der Ausführungsform sind vier Arten von Quantisierungsabschnitten und vier Arten von Dequantisierungsabschnitten verwendet. Allerdings wird angemerkt, dass die Anzahl der Arten sowohl der Quantisierungsabschnitte als auch der Dequantisierungsabschnitte nicht beschränkt ist.
  • Eine Codiervorrichtung gemäß der vorliegenden Erfindung ist aus einem Eingabeanschluss 1, einem Signalkonvertierungsabschnitt 2, einem Analysierabschnitt 3, einem Auswahlabschnitt 4, Quantisierungsabschnitten 50 bis 53, einem Multiplexabschnitt 6 und einem Ausgabeanschluss 7 gebildet. Die Quantisierungsabschnitte 50 bis 53 sind aus einem Pulsquantisierungsabschnitt 50 sowie aus einem Drei-Schritt-Quantisierungsabschnitt 51, einem Sieben-Schritt-Quantisierungsabschnitt 52 und einem 15-Schritt-Quantisierungsabschnitt 53 gebildet, die die gleichen sind wie jene, die in der herkömmlichen Codiervorrichtung verwendet sind.
  • Von dem Eingabeanschluss 1 wird ein digitales Audiosignal, z. B. PCM-Audioabtastwerte, geliefert. Jedes Mal, wenn 32 Abtastwerte eines Audiosignals eingegeben werden, konvertiert der Signalkonvertierungsabschnitt 2 ein Band des Audiosignals in 32 Frequenzdomänensignale und speichert 12 Sätze von Frequenzdomänensignalen, da 32 Frequenzdomänensignale ein Satz von Frequenzdomänensignalen sind. Diese 12 Sätze von Frequenzdomänensignalen jeder Frequenz bilden einen Block. Als ein Signalkonvertierungsprozess können eine Vielzahl konvertierter Koeffizienten mit aufeinander folgenden Frequenzindizes durch einen Fourier-Transformationsprozess oder durch einen diskreten Kosinustransformationsprozess anstelle des Bandunterteilungsprozesses als ein Block gruppiert werden.
  • Der Analysierabschnitt 3 berechnet unter Verwendung des Eingabeaudiosignals, der Frequenzdomänensignale usw. in der gleichen Weise wie im herkömmlichen Verfahren für jede Frequenz den Betrag des erlaubten Fehlers.
  • Während der Auswahlabschnitt 4 die Größe des Quantisierungsfehlers jedes Frequenzdomänensignals in der Weise einstellt, dass er proportional zu dem durch den Analysierabschnitt 3 definierten erlaubten Fehler ist, wählt der Auswahlab schnitt 4 einen Quantisierungsabschnitt in der Weise aus, dass die Anzahl der für die Codierung der Frequenzdomänensignale aller Blöcke erforderlichen Bits in einem erlaubten Bereich liegt, der der Übertragungsrate entspricht. Wie später beschrieben wird, codiert der ausgewählte Quantisierungsabschnitt das Frequenzdomänensignal jedes Blocks.
  • Der Multiplexabschnitt 6 multiplexiert die Quantisierungsabschnitt-Auswahlinformationen und die Ausgabe eines Quantisierungsabschnitts für jeden Block, bildet einen Bitstrom und liefert ihn über den Ausgabeanschluss 7.
  • Eine Decodiervorrichtung gemäß der vorliegenden Erfindung ist aus einem Eingabeanschluss 11, einem Demultiplexierungsabschnitt 12, einem Impulsdequantisierungsabschnitt 80, einem Drei-Schritt-Dequantisierungsabschnit 81, einem Sieben-Schritt-Dequantisierungsabschnitt 82, einem 15-Schritt-Dequantisierungsabschnitt 83, einem Abschnitt 13 für inverse Signalkonvertierung und einem Ausgabeanschluss 14 gebildet.
  • Von dem Eingabeanschluss 11 wird ein multiplexiertes Signal empfangen. Der Demultiplexierungsabschnitt 12 demultiplexiert das empfangene Signal in den Auswahlabschnitt und eine Ausgabe eines Quantisierungsabschnitts. Mit den Auswahlinformationen wird aus dem Impulsdequantisierungsabschnitt 80, aus dem Drei-Schritt-Dequantisierungsabschnitt 81, aus dem Sieben-Schritt-Dequantisierungsabschnitt 82 und aus dem 15-Schritt-Dequantisierungsabschnitt 83 ein Dequantisierungsabschnitt auswählt, der dem Quantisierungsverfahren auf der Codierungsseite entspricht. Wie später beschrieben wird, reproduziert der ausgewählte Dequantisierungsabschnitt die Frequenzdomänensignale jedes Blocks, der der Eingabe des Quantisierungsabschnitts entspricht. Der Abschnitt 13 für inverse Signalkonvertierung konvertiert die Frequenzdomänensignale invers in eine Zeitdomäne und liefert das resultierende Signal über den Ausgabeanschluss 14.
  • Nachfolgend werden mehrere Beispiele des Quantisierungsprozesses und des Dequantisierungsprozesses gemäß der vorliegenden Erfindung beschrieben.
  • Als ein erstes Beispiel codiert der Pulsquantisierungsabschnitt 80 die Frequenzdomänensignale mit großen hervorstehenden Amplitudenwerten, wenn die Frequenzdomänensignale jedes Blocks codiert werden. Die herkömmlichen Quantisierungsabschnitte codieren andere Frequenzdomänensignale. In dem Beispiel des Literaturhinweises des verwandten Gebiets quantisiert der Pulsquantisierungsabschnitt 50 das 11-te Teilbandsignal mit einem Amplitudenwert 0,92. Die herkömmlichen Quantisierungsabschnitte quantisieren andere Frequenzdomänensignale mit den Amplitudenwerten 0,10, –0,15, –0,03, 0,20, 0,05, 0,44, 0,05, –0,11, 0,32, –0,40 und 0,04.
  • Der Pulsquantisierungsabschnitt 50 berechnet den Amplitudenwert, die Polarität und den Index eines Teilbandsignals und gibt sie aus. Falls der Pulsquantisierungsabschnitt 50 ein Frequenzdomänensignal mit einem Amplitudenwert 0,92 verarbeitet, gibt der Pulsquantisierungsabschnitt 50 die Amplitudeninformation 1,0 (Index = 3) und die Polaritätsinformation positiv aus, wenn die in Tabelle 1 gezeigte Beziehung zwischen Index und Amplitudeninformationen angewendet wird. Da das Frequenzdomänensignal mit dem Amplitudenwert 0,92 an der 11-ten Stelle des Blocks angeordnet ist, ist die Indexinformation 11. Somit erfordert die Ausgabe des Pulsquantisierungsabschnitts 50 sechs Bits für die Amplitudeninformationen, ein Bit für die Polaritätsinformationen und vier Bits für die Frequenzindexinformationen, die 12 Signale des Blocks identifizieren. Da Frequenzdomänensignale mit großen hervorstehenden Amplitudenwerten ausgeschlossen sind, wird der maximale Amplitudenabsolutwert anderer Frequenzdomänensignale von 0,92 auf 0,44 verringert. Somit werden die Amplitudeninformationen dieser Frequenzdomänensignale zu 0,5 (Index = 6). Da der Quantisierungsfehler proportional zu {(Amplitudenwert L)/(Anzahl der Quantisierungsschritte S)} jedes Blocks ist, kann die Anzahl der erforderlichen Schritte von 15 auf 7 verringert werden, wenn die Frequenzdomänensignale mit dem ähnlichen Quantisierungsfehler wie jene des 15-Schritt-Quantisierungsabschnitts und des 15-Schritt-Dequantisierungsabschnitts quantisiert werden. Somit kann die Anzahl der zum Senden jedes Codes erforderlichen Bits von 4 auf 3 verringert werden. Der Sieben-Schritt-Quantisierungsabschnitt quantisiert die 11 Teilbandsignale und erhält die Codes 4, 2, 3, 4, 3, 6, 3, 2, 5, 0 und 3. Auf der Decodierungsseite decodiert der Sieben-Schritt-Dequantisierungsabschnitt 82 diese Codes und erhält die reproduzierten Frequenzdomänensignale 0,143, –0,143, 0,0, 0,143, 0,0, 0,429, 0,0, –0,143, 0,286, –0,429 und 0,0.
  • Schließlich können gemäß der vorliegenden Erfindung wie in Tabelle 3 gezeigt bei insgesamt 50 Bits die Codes aller Frequenzdomänensignale eines Blocks gesendet werden. Im Vergleich zu den 54 Bits des Literaturhinweises des verwandten Gebiets kann die Anzahl der erforderlichen Bits um vier Bits verringert werden.
  • [Tabelle 3] Bitzuweisung
    Figure 00110001
  • Nachfolgend werden der Pulsquantisierungsprozess und der Pulsdequantisierungsprozess mit dem Eingabesignal des Literaturhinweises des verwandten Gebiets beschrieben, falls die Anzahl der Quantisierungsschritte 3 ist.
  • Wenn die Anzahl der Quantisierungsschritte in einem Block drei ist, sind die Amplitudenwerte der quantisierten Frequenzdomänensignale "0" und "±" (die gleichen oder negativen Werte des Werts, der durch die Amplitudeninformationen angegeben wird). Mit anderen Worten, wenn Impulse mit negativen und positiven Amplitudenwerten mit einer Mitte von "0" angeordnet sind, können Frequenzdomänensignale des Blocks repräsentiert werden. Die zu sendenden Informationen sind Amplitudeninformationen gemeinsam mit Frequenzdomänensignalen des Blocks, ein Frequenzindex jedes mit einem Impuls imitierten Frequenzdomänensignals und ein Polaritätscode.
  • Da die Frequenzdomänensignale eines Blocks in dem Beispiel des Eingabesignals des Literaturhinweises des verwandten Gebiets mit drei Impulsen imitiert werden können, ist in Tabelle 4 eine Bitzuweisung gezeigt, wenn die Anzahl der in einem Block repräsentierten Frequenzdomänensignale auf vier beschränkt ist. Da die mit Impulsen imitierten Frequenzdomänensignale 6 (0,44), 10 (–0,40) und 11 (0,92) sind, werden die Informationen 6, 10 und 11 als Indizes codiert. Die Polaritäten dieser Codes sind positiv, negativ und positiv. Als Amplitudeninformationen werden 1,0 (Index = 3) als der Maximalamplitudenwert oder 0,630 (Index = 5) als der Durchschnitt der Amplitudenwerte der drei zu imitierenden Frequenzdomä nensignale verwendet.
  • [Tabelle 4] Bitzuweisung
    Figure 00120001
  • Die Anzahl der Bits für die Amplitudeninformationen, für den Index und für den Polaritätscode sind sechs, vier und eins. Somit ist die Gesamtzahl der Bits 23 Bits, d. h. weniger als 30 Bits in der Referenz zum Stand der Technik.
  • Wenn die Anzahl der Bits der Anzahlinformationen der zu codierenden Frequenzdomänensignale auf eins, zwei, drei oder vier geändert wird, können bis zu zwei, vier, acht und 16 Frequenzdomänensignale imitiert werden. Unter der Annahme, dass die Anzahl der zu imitierenden Frequenzdomänensignale M und die Anzahl der Bits für die Anzahlinformationen der zu codierenden Frequenzdomänensignale N ist (N = 1 bis 4), kann die Anzahl der erforderlichen Bits durch 6 + N + M × (4 + 1) ausgedrückt werden. Somit ist die Anzahl der benötigten Bits, wenn die Anzahl der in einem Rahmen repräsentierten Frequenzdomänensignale auf vier begrenzt ist, im Vergleich zu dem Literaturhinweis des verwandten Gebiets, in dem ein Drei-Schritt-Quantisierungsprozess verwendet wird, immer verringert.
  • Falls der Pulsquantisierungsprozess und der Pulsdequantisierungsprozess verwendet werden, kann die Anzahl der Bits verringert werden, wenn die Auswahl der zu codierenden Frequenzdomänensignale beschränkt wird. Zum Beispiel werden Beschränkungen dessen angewendet, welche 12 Frequenzdomänensignale eines Blocks in drei Gruppen unterteilt werden, wobei nur ein Frequenzdomänensignal jeder Gruppe codiert wird. Als ein Gruppierungsverfahren werden das erste, das vierte, das siebente und das zehnte Frequenzdomänensignal der ersten Gruppe zugewiesen. Das zweite, das fünfte, das achte und das elfte Frequenzdomänensignal werden der zweiten Gruppe zugewiesen. Das dritte, das sechste, das neunte und das elfte Frequenzdomänensignal werden der dritten Gruppe zugewiesen. Als ein Kriterium für die Auswahl eines Frequenzdomänensignals aus jeder Gruppe wird ein Amplitudenwert verwendet.
  • In dem Beispiel der Frequenzdomänensignale des Literaturhinweises des verwandten Gebiets ist das Frequenzdomänensignal mit dem größten Amplitudenabsolutwert der ersten Gruppe das zehnte Frequenzdomänensignal (–0,40). Das Frequenzdomänensignal mit dem größten Amplitudenabsolutwert der zweiten Gruppe ist das elfte Frequenzdomänensignal (0,92). Das Frequenzdomänensignal mit dem größten Amplitudenabsolutwert der dritten Gruppe ist das sechste Frequenzdomänensignal (0,44). In den Frequenzdomänensignalen, die den einzelnen Gruppen zugewiesen sind, haben das vierte Frequenzdomänensignal, das vierte Frequenzdomänensignal und das zweite Frequenzdomänensignal die größten Amplitudenwerte. Somit können die Frequenzdomänensignale an dem decodierenden Standort reproduziert werden, wenn außer den Amplitudeninformationen 4, 4 und 2 als die Indizes der ausgewählten Frequenzdomänensignale und negativ, positiv und positiv als die Polaritätsinformationen gesendet werden. Wie bei dem oben beschriebenen Beispiel werden an diesem Punkt 1,0 (Index = 3), basierend auf dem maximalen Amplitudenwert, oder 0,630 (Index = 5), basierend auf dem Durchschnittswert der Amplitudenwerte von drei zu imitierenden Frequenzdomänensignalen, als der Amplitudenwert verwendet.
  • Wie in Tabelle 5 gezeigt ist, ist die Anzahl der Bits, die zum Senden von Frequenzdomänensignalen eines Blocks erforderlich sind, sechs Bits für die Amplitudeninformationen des Blocks, zwei Bits für einen Index zum Auswählen eines von vier Frequenzdomänensignalen und ein Bit zum Repräsentieren der Polarität der Amplitude des ausgewählten Frequenzdomänensignals. Da insgesamt 15 Bits verwendet werden, ist somit die Anzahl der erforderlichen Bits im Vergleich zu der oben beschriebenen Ausführungsform verringert.
  • [Tabelle 5] Bitzuweisung
    Figure 00140001
  • Als ein Gruppierungsverfahren zum Gruppieren der Frequenzdomänensignale eines Blocks können das erste, das zweite, das dritte und das vierte Signal der ersten Gruppe zugewiesen werden. Das fünfte, das sechste, das siebente und das achte Signal können der zweiten Gruppe zugewiesen werden. Das neunte, das zehnte, das elfte und das zwölfte Frequenzdomänensignal können der dritten Gruppe zugewiesen werden.
  • In der oben beschriebenen Ausführungsform wurde beispielhaft ein Audiosignal erläutert. Allerdings wird angemerkt, dass ein Videosignal mit einer hervorstehenden Farbdichte oder mit einer größten Farbe mit einem Pulsquantisierungsabschnitt und mit einem Pulsdequantisierungsabschnitt behandelt werden kann, um die Gesamtzahl der Bits zu verringern.
  • Mit einem Pulsquantisierungsabschnitt 50 und einem Pulsdequantisierungsabschnitt 80, die einen Teil der Frequenzdomänensignale eines Blocks codieren und decodieren können, kann die Anzahl der für den Quantisierungsprozess erforderlichen Bits verringert werden. Somit kann für eine Signalquelle mit einer größeren hervorstehenden Amplitude als die anderen Signale in einem Block mit einer kleineren Anzahl von Bits als im herkömmlichen Verfahren die gleiche Codierungsqualität wie bei dem herkömmlichen Verfahren erreicht werden. Folglich kann die Codierungseffizienz verbessert werden.
  • Obgleich die vorliegende Erfindung in Bezug auf eine beste Ausführungsform davon gezeigt und geschrieben wurde, ist für den Fachmann auf dem Gebiet selbstverständlich, dass darin die vorstehenden sowie verschiedene weitere Änderungen, Weglassungen und Hinzufügungen in Bezug auf deren Form und Einzelheit vorgenommen werden können, ohne von dem Erfindungsgedanken und von dem Umfang der vorliegenden Erfindung abzuweichen.

Claims (11)

  1. Codiersystem für Signale, welches aufweist: – einen Signalkonvertierungsabschnitt (2) zum Konvertieren eines Eingabesignals in Frequenzdomänen-Signale und zum Gruppieren einer Mehrzahl von Frequenzdomänen-Signalen in Blöcke; – einen Analysierabschnitt (3) zum Analysieren des Eingabesignals und der Frequenzdomänen-Signale und zum Erhalten eines erlaubten Fehlers; – eine Vielzahl von Quantisierungsabschnitten (5053) zum Quantisieren von Frequenzdomänen-Signalen jeden Blocks, um Amplitudeninformationen und Codes zu berechnen; – einen Auswahlabschnitt (4) zur Ausgabe von Quantisierungsabschnitt-Auswahlinformationen zum Auswählen eines der Vielzahl von Quantisierungsabschnitten (5053), der dem erlaubten Fehler entspricht; und – einen Multiplexabschnitt (6) zum Multiplexen der Amplitudeninformationen, der Codes und der Quantisierungsabschnitt-Auswahlinformationen, dadurch gekennzeichnet, dass – die Quantisierungsabschnitte (5053) zumindest einen ersten Quantisierungsabschnitt (50) umfassen, und zwar zum Codieren nur eines Teils von Frequenzdomänen-Signalen, welche große hervorstehende Amplitudenwerte im Verhältnis zu den anderen Frequenzdomänen-Signalen in jedem Block aufweisen, sowie zumindest einen zweiten Quantisierungsabschnitt (5153) zum Codieren des Rests der Frequenzdomänen-Signale in jedem Block, die nicht in dem ersten Codierabschnitt (50) codiert werden.
  2. Codiersystem nach Anspruch 1, bei dem die Ausgaben des ersten Quantisierungsabschnitts (50) einen Amplitudenindex und einen Frequenzindex für jeden Block umfassen.
  3. Codiersystem nach Anspruch 1, bei dem die Ausgaben des ersten Quantisierungsabschnitts (50) für jeden Block einen repräsentativen Amplitudenindex und eine Vielzahl von Frequenzindices umfassen.
  4. Codiersystem nach einem der Ansprüche 1 bis 3, bei dem der erste Quantisierungsabschnitt (50) die Frequenzdomänen-Signale jedes Blocks in Gruppen unterteilt und einen repräsentativen Frequenzindex der Gruppen auswählt.
  5. Codiersystem nach einem der Ansprüche 1 bis 4, bei dem der erste Quantisierungsabschnitt (50) ein Pulsquantisierungsabschnitt ist.
  6. Decodiersystem für Signale, welches aufweist: – einen Demultiplexierungsabschnitt (12) zum Demultiplexieren von Eingabesignalen in Amplitudeninformationen, Codes, und Quantisierungsabschnitt-Auswahlinformationen; – eine Vielzahl von Dequantisierungsabschnitten (8083) zum Dequantisieren der Codes mit den Amplitudeninformationen, die den Quantisierungsabschnitt-Auswahlinformationen entsprechen; und – einen Abschnitt für inverse Signalkonvertierung (13) zum Konvertieren eines Blocks von Ausgabesignalen der Dequantisierungsabschnitte (8083), dadurch gekennzeichnet, dass – die Dequantisierungsabschnitte (8083) zumindest einen ersten Dequantisierungsabschnitt (80) umfassen, und zwar zum Decodieren nur eines Teils von Frequenzdomänen-Signalen in jedem Block, welche große hervorstehende Amplitudenwerte im Verhältnis zu den anderen Frequenzdomänen-Signalen in jedem Block aufweisen, sowie zumindest einen zweiten Dequantisierungsabschnitt (8183) zum Decodieren des Rests der Frequenzdomänen-Signale in jedem Block, die nicht in dem ersten Dequantisierungsabschnitt (80) decodiert wurden.
  7. Decodiersystem nach Anspruch 6, bei dem Eingaben des ersten Dequantisierungsabschnitts (80) einen Amplitudenindex und einen Frequenzindex für jeden Block umfassen.
  8. Decodiersystem nach Anspruch 6, bei dem Eingaben des ersten Dequantisierungsabschnitts (80) für jeden Block einen repräsentativen Amplitudenindex und eine Vielzahl von Frequenzindices umfassen.
  9. Decodiersystem nach einem der Ansprüche 6 bis 8, bei dem der erste Dequantisierungsabschnitt (80) die Frequenzdomänen-Signale jeden Blocks in Gruppen aufteilt und einen repräsentativen Frequenzindex der Gruppen auswählt.
  10. Decodiersystem nach einem der Ansprüche 6 bis 9, bei dem der erste Dequantisierungsabschnitt (80) ein Pulsdecodierungsabschnitt ist.
  11. Decodiersystem nach Anspruch 6, dadurch gekennzeichnet, dass der zumindest eine erste Dequantisierungsabschnitt (80) und der zumindest eine zweite Dequantisierungsabschnitt (8183) basierend auf der Quantisierungsabschnitt-Auswahlinformation ausgewählt werden, die den Teil von Frequenzdomänen-Signalen angibt, die große hervorstehende Amplitudenwerte im Verhältnis zu den anderen Frequenzdomänen-Signalen in jedem Block vor dem Codieren hatten.
DE69732870T 1996-01-10 1997-01-07 System zur Kodierung und Dekodierung von Audiosignalen Expired - Lifetime DE69732870T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP188196 1996-01-10
JP8001881A JP2820096B2 (ja) 1996-01-10 1996-01-10 符号化方式および復号方式

Publications (2)

Publication Number Publication Date
DE69732870D1 DE69732870D1 (de) 2005-05-04
DE69732870T2 true DE69732870T2 (de) 2006-04-06

Family

ID=11513916

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69732870T Expired - Lifetime DE69732870T2 (de) 1996-01-10 1997-01-07 System zur Kodierung und Dekodierung von Audiosignalen

Country Status (7)

Country Link
US (1) US5875424A (de)
EP (1) EP0784312B1 (de)
JP (1) JP2820096B2 (de)
KR (1) KR100262206B1 (de)
AU (1) AU718561B2 (de)
CA (1) CA2194199C (de)
DE (1) DE69732870T2 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2361132B (en) * 2000-04-07 2004-09-08 Snell & Wilcox Ltd Multiplexing compressed signals
KR101668093B1 (ko) * 2010-06-17 2016-10-21 삼성전자주식회사 데이터 인코딩 및 디코딩 방법 및 장치
US10015495B2 (en) * 2016-05-09 2018-07-03 Adobe Systems Incorporated Generating custom quantization tables for JPEG compression based on image content

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL7909098A (nl) * 1979-12-18 1981-07-16 Oce Nederland Bv Besturingsschakeling in een elektrofotografisch kopieerapparaat.
EP0300775B1 (de) * 1987-07-21 1995-05-31 Matsushita Electric Industrial Co., Ltd. Verfahren und Vorrichtung zur Codierung und Decodierung eines Signals
JPH0336826A (ja) * 1989-07-04 1991-02-18 Sony Corp 信号伝送装置
JPH0358570A (ja) * 1989-07-27 1991-03-13 Nec Corp 画像データ符号化方式
US5369724A (en) * 1992-01-17 1994-11-29 Massachusetts Institute Of Technology Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients
JPH06180948A (ja) * 1992-12-11 1994-06-28 Sony Corp ディジタル信号処理装置又は方法、及び記録媒体
JP3371590B2 (ja) * 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
KR100188934B1 (ko) * 1995-08-28 1999-06-01 윤종용 영상 신호 부호화 장치 및 방법

Also Published As

Publication number Publication date
DE69732870D1 (de) 2005-05-04
AU718561B2 (en) 2000-04-13
US5875424A (en) 1999-02-23
AU1007597A (en) 1997-07-17
EP0784312A2 (de) 1997-07-16
KR100262206B1 (ko) 2000-07-15
CA2194199A1 (en) 1997-07-11
EP0784312A3 (de) 1998-09-23
KR970060943A (ko) 1997-08-12
JP2820096B2 (ja) 1998-11-05
JPH09191254A (ja) 1997-07-22
EP0784312B1 (de) 2005-03-30
CA2194199C (en) 2000-12-05

Similar Documents

Publication Publication Date Title
DE69015695T2 (de) Einrichtung zur Transformationskodierung.
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
EP2022043B1 (de) Informationssignalcodierung
DE3688980T2 (de) Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens.
DE69534273T2 (de) Verfahren und vorrichtung zum signalkodieren, signalubertragungsverfahren und verfahren und vorrichtung zur signaldekodierung
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE60012860T2 (de) Verfahren zur Verarbeitung mehrerer digitaler Audiodatenströme
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
DE69834010T2 (de) Skalierbares stereo Tonkodierungs- und Tondekodierungsverfahren und Vorrichtung dafür
DE69705642T2 (de) Audio-kodierverfahren mit veränderlicher kodelänge unter verwendung einer mehrzahl von teilband-bitverteilungsmoden
DE69533577T2 (de) Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE60209888T2 (de) Kodieren eines audiosignals
DE69915400T2 (de) Vorrichtung zur Kodierung und Dekodierung von Audiosignalen
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
DE69529393T2 (de) Verfahren zur gewichteten Geräuschfilterung
DE4241131B4 (de) Einrichtung zum Kodieren und Dekodieren von Übertragungssignalen mittels Transformationen
DE69005010T2 (de) Einrichtung zur Sprachkodierung und -Dekodierung.
DE19811039A1 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
WO1999004505A1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
EP0201679A1 (de) Verfahren zur Bilddatenreduktion für digitale Fernsehsignale
DE69932861T2 (de) Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung
DE60214627T2 (de) Verfahren und Vorrichtung zur Bitratenkonversion
DE69533259T2 (de) Nichtlineares quantisieren eines informationssignales
DE69217590T2 (de) Verfahren und Einrichtung zur Kodierung eines digitalen Audiosignals

Legal Events

Date Code Title Description
8364 No opposition during term of opposition