EP1926082A1 - Process for scaleable encoding of stereo signals - Google Patents

Process for scaleable encoding of stereo signals Download PDF

Info

Publication number
EP1926082A1
EP1926082A1 EP07022523A EP07022523A EP1926082A1 EP 1926082 A1 EP1926082 A1 EP 1926082A1 EP 07022523 A EP07022523 A EP 07022523A EP 07022523 A EP07022523 A EP 07022523A EP 1926082 A1 EP1926082 A1 EP 1926082A1
Authority
EP
European Patent Office
Prior art keywords
signals
center
quantization
quantized
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP07022523A
Other languages
German (de)
French (fr)
Inventor
Bernhard Dr. Feiten
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Original Assignee
Deutsche Telekom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom AG filed Critical Deutsche Telekom AG
Publication of EP1926082A1 publication Critical patent/EP1926082A1/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Definitions

  • the present invention relates to the encoding of stereo signals, and more particularly to the application of scalable encoding techniques.
  • Scalable encoding methods for data compression of audio signals have the advantage that the transmission rate can be adapted dynamically to the properties of the networks and terminals.
  • a gradation of the bit rate by the coding method in small steps is particularly advantageous.
  • a stereo signal includes at least two channels, a left channel and a right channel.
  • the similarity between the two channels is exploited.
  • One known method of transmitting stereo signals is the mid / side method [ Michael Dickreiter, Handbuch der Tonstudiotechnik, Saur Verlag, 1997 ].
  • the left and right channels are combined with each other to produce a center channel and a side channel.
  • the center channel is made up of the sum of the right and left channels, while the side channel is made up of the difference between the left and right channels.
  • M 0 . 5 ⁇ R + L
  • S 0 . 5 ⁇ R - L
  • the factor 0.5 is a common size in practice and can also be chosen differently.
  • center / side processing will result in a significant saving in the amount of bits needed for encoding, since the side channel will then have relatively less energy than the left or right channel and To code the page channel much less bits are needed.
  • the center channel will be equal to the left channel or equal to the right channel, while the side channel would be 0. The more similar the left and right channels are, the less energy the page channel will be, and the fewer bits needed to encode the page channel. If the right and left channels are less similar, then the bit efficiency will decrease accordingly for center / page encoding.
  • the coding of the stereo signals is usually carried out with methods that process the audio signals in the spectral range.
  • the left and right channels of the audio signal which are usually in the form of PCM (Pulse Code Modulation) samples, are converted from the time domain to the frequency domain.
  • PCM Pulse Code Modulation
  • modern coding methods use the so-called modified discrete cosine transformation (MDCT) in order to obtain a block-wise frequency representation of an audio signal.
  • MDCT modified discrete cosine transformation
  • the stream of discrete-time audio samples is windowed to obtain a windowed block of audio samples, which are then transformed into a spectral representation by a transform. For each time window, one obtains a corresponding number of spectral coefficients.
  • the transformation divides the frequency spectrum into a certain number of frequency bands (subbands) of equal width.
  • the number of transformation points and the sampling rate determine the bandwidth of the subbands. These subbands are grouped according to hearing characteristics. At low frequencies, a few subbands fall into one group, many at high frequencies.
  • For each group a scaling factor is determined.
  • the quantization of the spectral coefficients then takes place relative to these scaling factors.
  • bits are assigned to the scaling factors and the transform coefficient according to the target bit rate. The bit allocation takes place in such a way that the resulting error can be perceived as little as possible.
  • the scaling factors are also transmitted and are required so that the decoder is able to reconstruct the original signal from the transmitted bits.
  • a middle / side coding for the signals of the left and right channels after the transformation into the frequency range MDCT is used for matrixing and subtraction.
  • the center and side signals thus formed are then quantized.
  • the quantization is a lossy coding, since process-related quantization errors occur.
  • the quantization errors mean that the signals can not be accurately reconstructed after transmission and an unnatural stereo image is formed.
  • the center / side encoding has the effect, in addition to the data reducing effect, that when the left and right channels are very similar, the quantization error in both the left channel and the right channel coincides with the quantization error of the other channel is correlated, so that the quantization error takes place in the middle and there is covered by the useful signal a little or much better than in the uncorrelated case.
  • the useful signal will be either left or right, while the quantization error is correlated and more in the middle.
  • the quantized middle / side signals are subsequently entropy-coded in the sense of a loss-free coding, for example by means of a Huffinan coding.
  • a bit stream is formed from the quantized and entropy-coded center-to-side signals by means of a bit stream multiplexer which can be transmitted.
  • Scalable coding methods are particularly advantageous for stereo signals [ J. Li; Embedded Audio Coding (EAC) With Implicit Auditory Masking; ACM Multimedia 2002 ].
  • Scalable coding methods are designed such that the output-side bit stream has at least a first and a second scaling layer.
  • the first scaling layer may differ from the second scaling layer or from any number of further scaling layers in the audio coding method itself, in the audio bandwidth, in the audio quality with respect to mono / stereo or in a combination of the quality criteria mentioned.
  • Scalable audio encoders for multichannel stereo transmission are often designed so that the mono signal, i.e., the first scaling layer, is the same. the center signal is used while in the other scaling layers the side channel is embedded.
  • a decoder that is simply designed will take only the first scaling layer from the scaled bitstream and provide a mono signal.
  • a stereo decoder also uses the side layer in addition to the center layer to provide a full bandwidth stereo signal.
  • a scalable stereo encoder that uses the center signal as the first scaling layer and the side signal in the other scaling layers has its best overall efficiency when there is a high similarity of the left channel to the right channel. For stereo channels that do not correlate or sudden changes in the characteristics of the two channels, the efficiency of a mid / side encoding is reduced.
  • the process of decoding a mid / side transmission is such that the received bit stream is divided by a demultiplexer into encoded quantized center / side signals and additional information.
  • the entropy-coded quantized center-to-side signals are first entropy-decoded to obtain the quantized center-to-side signals, which are then inversely quantized.
  • the decoded center / side signals have quantization errors introduced in the encoding and result in the signals for the left and right channels converted into the temporal representation after dematrixing and by means of a synthesis filter bank not being reconstructed in the original ratios can be
  • the object of the present invention is to achieve, for the application of the scalable coding according to the middle / side method, that spatial-related reproduction better obscures quantization errors and minimizes stereo imaging errors.
  • the object is achieved in that in the process of encoding the left channel and right channel are transformed and quantized by themselves and the middle / side processing only after the quantization takes place. The sum and subtraction is thus carried out with the already quantized signals of the left and right channels.
  • the invention is based on the finding that the effect of the quantization error in the center / side matrixing can be reduced if the matrixing is carried out after the quantization. This can be shown using the transfer equations.
  • the center signal is formed by the addition of the left and right channel, the side signal is formed by the difference.
  • M 0 . 5 ⁇ R + 0 . 5 ⁇ L
  • S 0 . 5 ⁇ R - 0 . 5 ⁇ L
  • R ' Q ⁇ 0 . 5 ⁇ R + 0 . 5 ⁇ L + Q ⁇ 0 . 5 ⁇ R - 0 . 5 ⁇ L
  • L' Q ⁇ 0 . 5 ⁇ R + 0 . 5 ⁇ L - Q ⁇ 0 . 5 ⁇ R - 0 . 5 ⁇ L
  • R ' Q ⁇ 0 . 5 ⁇ R + 0 . 5 ⁇ L
  • L' Q ⁇ 0 . 5 ⁇ R + 0 . 5 ⁇ L
  • the inventive optimization of the center / side stereophony using the quantization for the signals of the right and the left channel is as follows.
  • the quantization error is denoted by d and can assume the values -D / 2 ⁇ d ⁇ D / 2 .
  • the quantization error of the center signal is dm, that of the side signal ds. There is a random relationship between dm and ds .
  • the quantization error in the M / S quantization can take in the sum of values between - D and + D.
  • dr is the quantization error for the right channel
  • dl the quantization error for the left channel.
  • the quantization error d can assume the values - D / 2 ⁇ d ⁇ D / 2 , as already illustrated.
  • R / L quantization the quantization errors do not add up. Thus the error remains in the range -D / 2 ⁇ d ⁇ D / 2.
  • encoders and decoders are shown as an example of the application of the inventive principle of center / page formation after the quantization of the signals of the left and right channels.
  • the description is limited to a two-channel transmission and encoding. However, the same principles can also be applied to multi-channel transmission and coding.
  • the left (10) and right channel (20) of an audio signal are first transformed from the time domain into the frequency domain.
  • the known principle of the sliding modified cosine transform (200) is used for both audio channels.
  • the spectral values of the left (11) and right (12) channels are quantized in the next step.
  • the quantizer (300) is controlled by a quantization controller (500).
  • the quantization can, as is known from other methods, be supported by a division into frequency bands. This division has the advantage that the quantization error is adapted to the spectral properties of the useful signal and thus is not audible so quickly for our hearing.
  • the quantization is adapted to the modulation in the respective frequency band by a band for each band Scaling factor is determined.
  • the quantization controller uses the left (10) and right (20) input channels to determine the scaling factors.
  • a special feature of the quantization control in the new coding method is that the same scaling factor must be used for the left and right channel in order to enable the sum and difference formation in a linear number space.
  • various known methods can be used to determine the optimal scaling factors [ Marina Bosi and Karlheinz Brandenburg; Introduction to Digital Audio Coding and Standards; Springer Verlag 2002 ].
  • the quantization fulfills the function of a lossy reduction of the bits required for the coding.
  • the spectrally decomposed and quantized left (12) and right (22) channels are now fed to a center / side transformation stage (100) for converting left / right signals into center / side signals.
  • a center / side transformation stage 100
  • Another data reduction took place in a further stage for lossless coding (400).
  • This stage which can be realized, for example, as usual in other coding methods with a Huffman coding, the center (40) and side signals (50) and the scaling factors (60) are supplied.
  • the result is the coded signal (80).
  • the decoding of the encoded signal (80) is done by performing the steps in reverse order.
  • the lossless decoding reconstructs the center (41) and side signals (51) as well as the scaling factors (61).
  • the center and side signals are transformed back to left (13) and right (23) quantized signals.
  • inverse quantization (301) is carried out to produce the original values of the spectral coefficients.
  • the spectrally decomposed left (14) and right (15) signals are reset with the inverse modified discrete cosine transform (201) to the reconstructed signals for the left (15) and right (25) channels.
  • the present invention for minimizing the quantization errors also makes it possible in practice to make the generation of the bit stream more flexible.
  • the encoded signal (80) can be scaled in size (bit rate).
  • the bitstream contains the scaling factors, the center signal and the side signal.
  • the bitrate can now be reduced in several ways. First, high-frequency components of the side signal can be omitted. Then, for example, the high frequency components of the center signal can be omitted. The unused scaling factors then do not need to be transmitted. In the next step, the low-frequency components of the side signal could then be reduced until, for example, the side signal no longer occurs in the bit stream. The quality of the stereo transmission can thus be transferred step by step into a mono transmission with decreasing spectral bandwidth.

Abstract

The method involves transforming stereo signals of left and right channels (10, 20) before center/side processing from a time domain into a frequency domain. The signals are separately quantized according to matrixing for sum and difference formations for compression of data and according to the transformation in the frequency range. The quantized signals of the channels are matrixed for forming center and side signals (40, 50). The center and side signals formed from the quantized signals are utilized in a stage of loss-less encoding (400) for transmission in an encoded signal.

Description

Die vorliegende Erfindung bezieht sich auf die Codierung von Stereosignalen und insbesondere auf die Anwendung skalierbarer Codierverfahren.The present invention relates to the encoding of stereo signals, and more particularly to the application of scalable encoding techniques.

Skalierbare Codierverfahren zur Datenkompression von Audiosignalen haben den Vorteil, dass die Übertragungsrate dynamisch an die Eigenschaften der Netzwerke und Endgeräte angepasst werden kann. Eine Abstufung der Bitrate durch das Codierverfahren in kleinen Schritten ist dabei besonders vorteilhaft.Scalable encoding methods for data compression of audio signals have the advantage that the transmission rate can be adapted dynamically to the properties of the networks and terminals. A gradation of the bit rate by the coding method in small steps is particularly advantageous.

Ein Stereosignal umfasst mindestens zwei Kanäle, einen linken Kanal und einen rechten Kanal. Für eine datenreduzierende Codierung wird die Ähnlichkeit zwischen den beiden Kanälen ausgenutzt. Ein bekanntes Verfahren zur Übertragung von Stereosignalen ist das Mitte/Seite-Verfahren [ Michael Dickreiter, Handbuch der Tonstudiotechnik, Saur Verlag, 1997 ]. Dabei werden der linke und der rechte Kanal mit einander kombiniert, um einen Mitte-Kanal und einen Seite-Kanal zu erzeugen. Der Mitte-Kanal wird aus der Summe des rechten und linken Kanals gebildet, während der Seite-Kanal aus der Differenz des linken und rechten Kanals entsteht. Als Gleichung dargestellt bedeutet das: M = 0 , 5 R + L

Figure imgb0001
S = 0 , 5 R - L
Figure imgb0002
A stereo signal includes at least two channels, a left channel and a right channel. For a data-reducing coding, the similarity between the two channels is exploited. One known method of transmitting stereo signals is the mid / side method [ Michael Dickreiter, Handbuch der Tonstudiotechnik, Saur Verlag, 1997 ]. In this case, the left and right channels are combined with each other to produce a center channel and a side channel. The center channel is made up of the sum of the right and left channels, while the side channel is made up of the difference between the left and right channels. As an equation, this means: M = 0 . 5 R + L
Figure imgb0001
S = 0 . 5 R - L
Figure imgb0002

Der Faktor 0,5 ist eine in der Praxis übliche Größe und kann auch anders gewählt werden. Die Rückgewinnung des rechten und des linken Kanals erfolgt dann aus der Beziehung R = M + S

Figure imgb0003
L = M - S
Figure imgb0004
The factor 0.5 is a common size in practice and can also be chosen differently. The recovery of the right and left channels then takes place from the relationship R = M + S
Figure imgb0003
L = M - S
Figure imgb0004

Wenn der linke Kanal und der rechte Kanal relativ ähnlich zueinander sind, so bringt eine Mitte/Seite-Verarbeitung eine deutliche Einsparung der zum Codieren benötigten Bitmenge, da der Seite-Kanal dann relativ weniger Energie als der linke oder rechte Kanal aufweist und zur Codierung des Seite-Kanals wesentlich weniger Bits benötigt werden. Im Grenzfall, bei dem der linke Kanal und der rechte Kanal identisch sind, wird der Mitte-Kanal gleich dem linken Kanal oder gleich dem rechten Kanal sein, während der Seite-Kanal 0 wäre. Je ähnlicher sich der linke und der rechte Kanal sind, desto energieärmer wird der Seite-Kanal sein, und umso weniger Bits werden zur Codierung des Seite-Kanals benötigt. Sind der rechte und der linke Kanal weniger ähnlich, geht die Biteffizienz bei einer Mitte/Seite-Codierung entsprechend zurück.If the left channel and the right channel are relatively similar to one another, center / side processing will result in a significant saving in the amount of bits needed for encoding, since the side channel will then have relatively less energy than the left or right channel and To code the page channel much less bits are needed. In the limit case where the left channel and the right channel are identical, the center channel will be equal to the left channel or equal to the right channel, while the side channel would be 0. The more similar the left and right channels are, the less energy the page channel will be, and the fewer bits needed to encode the page channel. If the right and left channels are less similar, then the bit efficiency will decrease accordingly for center / page encoding.

Nach dem Stand der Technik erfolgt die Codierung der Stereosignale in der Regel mit Verfahren, die die Audiosignale im Spektralbereich bearbeiten. Zunächst werden der linke und rechte Kanal des Audiosignals, die in der Regel in Form von PCM-Abtastwerten (Puls Code Modulation) vorliegen, aus dem Zeitbereich in den Frequenzbereich umgesetzt. Für diese Transformation verwenden moderne Codierverfahren beispielsweise die sogenannte Modifizierte Diskrete Cosinus-Transformation (MDCT), um eine blockweise Frequenzdarstellung eines Audiosignals zu erhalten. Der Strom von zeitdiskreten Audio-Abtastwerten wird gefenstert, um einen gefensterten Block von Audio-Abtastwerten zu erhalten, die dann mittels einer Transformation in eine spektrale Darstellung umgesetzt werden. Für jedes Zeitfenster erhält man eine entsprechende Anzahl von Spektralkoeffizienten. Durch die Transformation wird das Frequenzspektrum in eine bestimmte Anzahl von Frequenzbändern (Subbändern) gleicher Breite unterteilt. Die Anzahl der Transformationspunkte und die Abtastrate bestimmen die Bandbreite der Subbänder. Diese Subbänder werden in Anlehnung an Gehöreigenschaften in Gruppen zusammengefasst. Bei tiefen Frequenzen fallen wenige Subbänder in eine Gruppe, bei hohen Frequenzen viele. Für jede Gruppe wird ein Skalierungsfaktor bestimmt. Die Quantisierung der Spektralkoeffizienten erfolgt dann relativ zu diesen Skalierungsfaktoren. Während der Codierung werden entsprechend der Zielbitrate den Skalierungsfaktoren und den Transformationskoeffizienten Bits zugewiesen. Die Bit-Allokierung erfolgt dabei derart, dass der entstehende Fehler möglichst wenig wahrgenommen werden kann. Die Skalierungsfaktoren werden mit übertragen und sind erforderlich, damit es dem Decodierer möglich ist, aus den übertragenen Bits das Original-Signal wieder rekonstruieren zu können.In the prior art, the coding of the stereo signals is usually carried out with methods that process the audio signals in the spectral range. First, the left and right channels of the audio signal, which are usually in the form of PCM (Pulse Code Modulation) samples, are converted from the time domain to the frequency domain. For this transformation, for example, modern coding methods use the so-called modified discrete cosine transformation (MDCT) in order to obtain a block-wise frequency representation of an audio signal. The stream of discrete-time audio samples is windowed to obtain a windowed block of audio samples, which are then transformed into a spectral representation by a transform. For each time window, one obtains a corresponding number of spectral coefficients. The transformation divides the frequency spectrum into a certain number of frequency bands (subbands) of equal width. The number of transformation points and the sampling rate determine the bandwidth of the subbands. These subbands are grouped according to hearing characteristics. At low frequencies, a few subbands fall into one group, many at high frequencies. For each group a scaling factor is determined. The quantization of the spectral coefficients then takes place relative to these scaling factors. During encoding, bits are assigned to the scaling factors and the transform coefficient according to the target bit rate. The bit allocation takes place in such a way that the resulting error can be perceived as little as possible. The scaling factors are also transmitted and are required so that the decoder is able to reconstruct the original signal from the transmitted bits.

Bei einer Mitte/Seite-Codierung erfolgt für die Signale des linken und rechten Kanals nach der Transformation in den Frequenzbereich mittels MDCT eine Matrizierung zur Summen- und Differenzbildung. Die so gebildeten Mitte- und Seite-Signale werden anschließend quantisiert. Die Quantisierung ist eine verlustbehaftete Codierung, da verfahrensbedingt Quantisierungsfehler auftreten. Die Quantisierungsfehler führen dazu, dass die Signale nach der Übertragung nicht mehr genau rekonstruiert werden können und ein unnatürliches Stereoabbild entsteht.In the case of a middle / side coding, for the signals of the left and right channels after the transformation into the frequency range MDCT is used for matrixing and subtraction. The center and side signals thus formed are then quantized. The quantization is a lossy coding, since process-related quantization errors occur. The quantization errors mean that the signals can not be accurately reconstructed after transmission and an unnatural stereo image is formed.

Die Mitte/Seite-Codierung hat, neben der Daten-reduzierenden Wirkung auch den Effekt, dass, wenn sich der linke und der rechte Kanal sehr ähnlich sind, der Quantisierungsfehler sowohl im linken Kanal als auch im rechten Kanal mit dem Quantisierungsfehler des jeweils anderen Kanals korreliert wird, so dass auch der Quantisierungsfehler in der Mitte stattfindet und dort von dem Nutzsignal ein wenig bzw. wesentlich besser als im unkorrelierten Fall verdeckt wird. Sobald aber der linke und rechte Kanal relativ unähnlich sind, so wird aufgrund des Stereoeffekts das Nutzsignal entweder links oder rechts sein, während der Quantisierungsfehler korreliert ist und eher in der Mitte liegt.The center / side encoding has the effect, in addition to the data reducing effect, that when the left and right channels are very similar, the quantization error in both the left channel and the right channel coincides with the quantization error of the other channel is correlated, so that the quantization error takes place in the middle and there is covered by the useful signal a little or much better than in the uncorrelated case. However, as soon as the left and right channels are relatively dissimilar, due to the stereo effect, the useful signal will be either left or right, while the quantization error is correlated and more in the middle.

Um bei der Codierung eine weitere Datenmengenreduktion zu erhalten, werden die quantisierten Mitte/Seite-Signale anschließend im Sinne einer verlustfreien Codierung beispielsweise mittels einer Huffinan-Codierung Entropie-codiert. Durch Hinzufügen weiterer Informationen, wie beispielsweise Skalierungsfaktoren wird aus den quantisierten und Entropie-codierten Mitte/Seite-Signalen mittels eines Bitstrom-Multiplexers ein Bitstrom gebildet, der übertragen werden kann.In order to obtain a further data volume reduction in the coding, the quantized middle / side signals are subsequently entropy-coded in the sense of a loss-free coding, for example by means of a Huffinan coding. By adding more information, such as scaling factors, a bit stream is formed from the quantized and entropy-coded center-to-side signals by means of a bit stream multiplexer which can be transmitted.

Skalierbare Codierverfahren sind für Stereosignale besonders vorteilhaft [ J. Li; Embedded Audio Coding (EAC) With Implicit Auditory Masking; ACM Multimedia 2002 ]. Skalierbare Codierverfahren sind so ausgebildet, dass der ausgangsseitige Bitstrom zumindest eine erste und eine zweite Skalierungsschicht aufweist. Die erste Skalierungsschicht kann sich von der zweiten Skalierungsschicht bzw. von einer beliebigen Anzahl weiterer Skalierungsschichten im Audiocodierverfahren selbst, in der Audiobandbreite, in der Audioqualität bezüglich Mono/Stereo oder in einer Kombination der genannten Qualitätskriterien unterscheiden.Scalable coding methods are particularly advantageous for stereo signals [ J. Li; Embedded Audio Coding (EAC) With Implicit Auditory Masking; ACM Multimedia 2002 ]. Scalable coding methods are designed such that the output-side bit stream has at least a first and a second scaling layer. The first scaling layer may differ from the second scaling layer or from any number of further scaling layers in the audio coding method itself, in the audio bandwidth, in the audio quality with respect to mono / stereo or in a combination of the quality criteria mentioned.

Skalierbare Audiocodierer für eine mehrkanalige Stereoübertragung sind häufig so ausgelegt, dass für die erste Skalierungsschicht das Mono-Signal, d.h. das Mitte-Signal verwendet wird, während in den weiteren Skalierungsschichten der Seite-Kanal eingebettet wird. Ein Decodierer, der nur einfach ausgelegt ist, wird aus dem skalierten Bitstrom lediglich die erste Skalierungsschicht entnehmen und ein Monosignal liefern. Ein Decodierer für die Stereo-Wiedergabe verwendet neben der Mitte-Schicht auch die Seite-Schicht, um ein Stereosignal mit voller Bandbreite zu liefern.Scalable audio encoders for multichannel stereo transmission are often designed so that the mono signal, i.e., the first scaling layer, is the same. the center signal is used while in the other scaling layers the side channel is embedded. A decoder that is simply designed will take only the first scaling layer from the scaled bitstream and provide a mono signal. A stereo decoder also uses the side layer in addition to the center layer to provide a full bandwidth stereo signal.

Ein skalierbarer Codierer für Stereosignale, der als erste Skalierungsschicht das Mitte-Signal und in den weiteren Skalierungsschichten das Seite-Signal verwendet, hat seine beste Gesamteffizienz dann, wenn eine hohe Ähnlichkeit des linken Kanals mit dem rechten Kanal besteht. Bei Stereokanälen, die nicht miteinander korrelieren, oder plötzlichen Änderungen der Eigenschaften der beiden Kanäle zueinander geht die Effizienz einer Mitte/Seite-Codierung zurück.A scalable stereo encoder that uses the center signal as the first scaling layer and the side signal in the other scaling layers has its best overall efficiency when there is a high similarity of the left channel to the right channel. For stereo channels that do not correlate or sudden changes in the characteristics of the two channels, the efficiency of a mid / side encoding is reduced.

Der Prozess der Decodierung einer Mitte/Seite-Übertragung stellt sich so dar, dass der empfangene Bitstrom mittels eines Demultiplexers in codierte quantisierte Mitte/Seite-Signale und zusätzliche Informationen aufgeteilt wird. Die Entropie-codierten quantisierten Mitte/Seite-Signale werden zunächst Entropie-decodiert, um die quantisierten Mitte/Seite-Signale zu erhalten, die dann invers quantisiert werden. Die decodierten Mitte/Seite-Signale weisen Quantisierungsfehler auf, die bei der Codierung eingebracht wurden und dazu führen, dass die nach der Dematrizierung und mittels einer Synthese-Filterbank in die zeitliche Darstellung umgesetzten Signale für den linken und rechten Kanal nicht in den ursprünglichen Verhältnissen rekonstruiert werden könnenThe process of decoding a mid / side transmission is such that the received bit stream is divided by a demultiplexer into encoded quantized center / side signals and additional information. The entropy-coded quantized center-to-side signals are first entropy-decoded to obtain the quantized center-to-side signals, which are then inversely quantized. The decoded center / side signals have quantization errors introduced in the encoding and result in the signals for the left and right channels converted into the temporal representation after dematrixing and by means of a synthesis filter bank not being reconstructed in the original ratios can be

Die vorliegende Erfindung stellt sich die Aufgabe, für die Anwendung der skalierbaren Codierung nach dem Mitte/Seite -Verfahren zu erreichen, dass bei der raumbezogenen Wiedergabe Quantisierungsfehler besser verdeckt und Stereoabbildungsfehler minimiert werden.The object of the present invention is to achieve, for the application of the scalable coding according to the middle / side method, that spatial-related reproduction better obscures quantization errors and minimizes stereo imaging errors.

Die Aufgabe wird dadurch gelöst, dass im Prozess der Codierung der linke Kanal und auch rechte Kanal für sich transformiert und quantisiert werden und die Mitte/Seite-Verarbeitung erst nach der Quantisierung erfolgt. Die Summen- und Differenzbildung wird also mit den bereits quantisierten Signalen des linken und rechten Kanals ausgeführt.The object is achieved in that in the process of encoding the left channel and right channel are transformed and quantized by themselves and the middle / side processing only after the quantization takes place. The sum and subtraction is thus carried out with the already quantized signals of the left and right channels.

Der Erfindung liegt die Erkenntnis zugrunde, dass sich der Effekt des Quantisierungsfehlers bei der Mitte/Seite-Matrizierung reduzieren lässt, wenn die Matrizierung nach der Quantisierung vorgenommen wird. Dies lässt sich anhand der Übertragungsgleichungen zeigen.The invention is based on the finding that the effect of the quantization error in the center / side matrixing can be reduced if the matrixing is carried out after the quantization. This can be shown using the transfer equations.

Das Mittesignal wird durch die Addition des linken und rechten Kanals gebildet, das Seitesignal entsteht durch die Differenz. M = 0 , 5 R + 0 , 5 L S = 0 , 5 R - 0 , 5 L

Figure imgb0005
The center signal is formed by the addition of the left and right channel, the side signal is formed by the difference. M = 0 . 5 R + 0 . 5 L S = 0 . 5 R - 0 . 5 L
Figure imgb0005

Die Rückgewinnung des rechten und linken Kanal erfolgt mit den Operationen: R = M + S L = M - S

Figure imgb0006
The recovery of the right and left channel is done with the operations: R = M + S L = M - S
Figure imgb0006

Der Quantisierungsvorgang wird durch die Quantisierungsfunktion y = Q x beschrieben .

Figure imgb0007
The quantization process is performed by the quantization function y = Q x described ,
Figure imgb0007

Für die herkömmliche Codierung unter Anwendung der Quantisierung für die Mitte/Seite-Signale (M/S-Quantisierung) ergeben sich die Übertragungsgleichungen: = Q 0 , 5 R + 0 , 5 L + Q 0 , 5 R - 0 , 5 L = Q 0 , 5 R + 0 , 5 L - Q 0 , 5 R - 0 , 5 L

Figure imgb0008
For conventional coding using quantization for the mid / side signals (M / S quantization), the transmission equations result: R ' = Q 0 . 5 R + 0 . 5 L + Q 0 . 5 R - 0 . 5 L L' = Q 0 . 5 R + 0 . 5 L - Q 0 . 5 R - 0 . 5 L
Figure imgb0008

Wird nur das Monosignal zur Decodierung herangezogen ergibt sich: = Q 0 , 5 R + 0 , 5 L

Figure imgb0009
= Q 0 , 5 R + 0 , 5 L
Figure imgb0010
If only the mono signal is used for decoding then: R ' = Q 0 . 5 R + 0 . 5 L
Figure imgb0009
L' = Q 0 . 5 R + 0 . 5 L
Figure imgb0010

Die erfindungsgemäße Optimierung der Mitte/Seite-Stereofonie unter Anwendung der Quantisierung für die Signale des rechten und des linken Kanals (R/L-Quantisierung) stellt sich wie folgt dar. Summen- und Differenzsignal werden aus den quantisierten R/L-Signalen gebildet: M = 0 , 5 Q R + 0 , 5 Q L

Figure imgb0011
S = 0 , 5 Q R - 0 , 5 Q L
Figure imgb0012
The inventive optimization of the center / side stereophony using the quantization for the signals of the right and the left channel (R / L quantization) is as follows. The sum and difference signals are formed from the quantized R / L signals: M = 0 . 5 Q R + 0 . 5 Q L
Figure imgb0011
S = 0 . 5 Q R - 0 . 5 Q L
Figure imgb0012

Die Einsetzung in Gleichung (2) ergibt dann: = 0 , 5 Q R + 0 , 5 Q L + 0 , 5 Q R - 0 , 5 Q L

Figure imgb0013
= 0 , 5 Q R + 0 , 5 Q L - 0 , 5 Q R - 0 , 5 Q L
Figure imgb0014
The insertion in equation (2) then yields: R ' = 0 . 5 Q R + 0 . 5 Q L + 0 . 5 Q R - 0 . 5 Q L
Figure imgb0013
L' = 0 . 5 Q R + 0 . 5 Q L - 0 . 5 Q R - 0 . 5 Q L
Figure imgb0014

Daraus resultiert für die Optimierung: = Q R = Q L

Figure imgb0015
This results for the optimization: R ' = Q R L' = Q L
Figure imgb0015

Wird nur das Monosignal zur Decodierung herangezogen ergibt sich: = 0 , 5 Q R + 0 , 5 Q L

Figure imgb0016
= 0 , 5 Q R + 0 , 5 Q L
Figure imgb0017
If only the mono signal is used for decoding then: R ' = 0 . 5 Q R + 0 . 5 Q L
Figure imgb0016
L' = 0 . 5 Q R + 0 . 5 Q L
Figure imgb0017

Zur Bewertung des Einflusses der entstehenden Quantisierungsfehler wird eine Ansteuerung des Systems mit Stereosignalen folgender Form betrachtet: Xr = a X X 1 = 1 - a X

Figure imgb0018
To evaluate the influence of the resulting quantization errors, a control of the system with stereo signals of the following form is considered: xr = a X X 1 = 1 - a X
Figure imgb0018

Für a=0 wird nur der linke Kanal ausgesteuert, für a=0,5 werden der linke und der rechte Kanal gleichermaßen ausgesteuert und für a =1 wird nur der rechte Kanal ausgesteuert.For a = 0, only the left channel is controlled, for a = 0.5 the left and right channels are equally controlled and for a = 1 only the right channel is controlled.

Für die herkömmliche Übertragung unter Anwendung der M/S-Quantisierung ergeben sich nach Gleichung (4) für die Eingangssignale folgende Ausgangssignale: Xrʹ = Q 0 , 5 X + Q a X - 0 , 5 X Xlʹ = Q 0 , 5 X - Q a X - 0 , 5 X

Figure imgb0019
For conventional transmission using M / S quantization, the following output signals are obtained according to equation (4) for the input signals: Xr' = Q 0 . 5 X + Q a X - 0 . 5 X Xl' = Q 0 . 5 X - Q a X - 0 . 5 X
Figure imgb0019

Für die erfindungsgemäße Optimierung unter Anwendung der R/L-Quantisierung erhält man demgemäß folgende Ausgangssignale: Xrʹ = Q a X X 1 ʹ = Q 1 - a X

Figure imgb0020
For the optimization according to the invention using the R / L quantization, the following output signals are thus obtained: Xr' = Q a X X 1 ' = Q 1 - a X
Figure imgb0020

Bei einem Wert von a =0,5 sind die Ergebnisse für die Ausgangssignale in beiden Darstellungen identisch. Der Regelfall in der Praxis ist aber, dass a einen beliebigen Wert zwischen 0 und 1 annimmt. Kritische Situationen treten auf, wenn sich a den Grenzen 0 oder 1 nähert. Der eine Kanal ist dann durch das Quellsignal stark ausgesteuert, der andere Kanal ist schwach ausgesteuert.At a value of a = 0.5, the results for the output signals are identical in both representations. The rule in practice, however, is that a assumes an arbitrary value between 0 and 1. Critical situations occur when a approaches 0 or 1. The one channel is then strongly controlled by the source signal, the other channel is weakly controlled.

Zur Darstellung des Quantisierungsfehlers wird ein Quantisierer mit einem Quantisiserungsintervall der Größe D angenommen. Der Quantisierungsfehler wird mit d bezeichnet und kann die Werte -D/2 < d < D/2 annehmen.To represent the quantization error, a quantizer with a size D quantization interval is assumed. The quantization error is denoted by d and can assume the values -D / 2 <d < D / 2 .

Für die herkömmliche Anwendung der M/S-Quantisierung ergeben sich nach Gleichung (7): Xrʹ = 0 , 5 X + dm + a X - 0 , 5 X + ds Xlʹ = 0 , 5 X + dm - a X - 0 , 5 X + ds

Figure imgb0021
For the conventional application of M / S quantization, equation (7) yields: Xr' = 0 . 5 X + dm + a X - 0 . 5 X + ds Xl' = 0 . 5 X + dm - a X - 0 . 5 X + ds
Figure imgb0021

Der Quantisierungsfehler des Mitte-Signals ist dm, der des Seite-Signals ds. Zwischen dm und ds besteht eine Zufallsbeziehung. Der Quantisierungsfehler bei der M/S-Quantisierung kann in der Summe Werte zwischen -D und +D annehmen.The quantization error of the center signal is dm, that of the side signal ds. There is a random relationship between dm and ds . The quantization error in the M / S quantization can take in the sum of values between - D and + D.

Für die Ausgangssignale ergeben sich bei einer Ansteuerung mit beispielsweise a = 0 Xrʹ = dm + ds Xlʹ = X + dm - ds

Figure imgb0022

und für a = 0 , 5 Xrʹ = 0 , 5 X + dm + ds Xlʹ = 0 , 5 X + dm - ds
Figure imgb0023
For the output signals resulting in a control with, for example a = 0 Xr' = dm + ds Xl' = X + dm - ds
Figure imgb0022

and for a = 0 . 5 Xr' = 0 . 5 X + dm + ds Xl' = 0 . 5 X + dm - ds
Figure imgb0023

Bei a=0 ist im rechten Kanal ein Quantisierungsfehler hörbar, obwohl nur der linke Kanal das Signal aufweist. Bei a=0,5 ist erkennbar, dass der Quantisierungsfehler mit gleichphasiger und gegenphasiger Komponente auftritt. Das führt dazu, dass der Quantisierungsfehler mit einer großen Stereowirkung hörbar wird.When a = 0 in the right channel, a quantization error is audible, although only the left channel having the signal. At a = 0.5, it can be seen that the quantization error occurs with in-phase and out-of-phase components. As a result, the quantization error becomes audible with a large stereo effect.

Für die erfindungsgemäße Optimierung unter Anwendung der R/L-Quantisierung ergeben sich nach Gleichung (8) folgende Beziehungen: Xrʹ = a X + dr X 1 ʹ = 1 - a X + dl

Figure imgb0024
For the optimization according to the invention using the R / L quantization, the following relations result according to equation (8): Xr' = a X + dr X 1 ' = 1 - a X + dl
Figure imgb0024

dr ist der Quantisierungsfehler für den rechten Kanal, dl der Quantisierungsfehler für den linken Kanal. Für einen Quantisierungsintervall der Größe D kann der Quantisierungsfehler d wie schon dargestellt die Werte -D/2 < d < D/2 annehmen. Bei der R/L-Quantisierung summieren sich die Quantisierungsfehler nicht. Somit bleibt der Fehler im Bereich -D/2 < d < D/2. dr is the quantization error for the right channel, dl the quantization error for the left channel. For a quantization interval of size D , the quantization error d can assume the values - D / 2 < d < D / 2 , as already illustrated. In R / L quantization, the quantization errors do not add up. Thus the error remains in the range -D / 2 <d <D / 2.

Für die Ausgangssignale ergeben sich für a = 0

Figure imgb0025
Xrʹ = dr X 1 ʹ = X + dl
Figure imgb0026

und für a = 0 , 5 Xrʹ = 0 , 5 X + dr Xlʹ = 0 , 5 X + dl
Figure imgb0027

Im Vergleich zur herkömmlichen M/S-Quantisierung ist bei der R/L-Quantisierung nur ein Quantisierungsfehler möglich, der maximal halb so groß ist und keine gegenphasigen Komponenten aufweist, so dass das Nutzsignal den Quantisierungsfehler wesentlich besser verdeckt.For the output signals arise for a = 0
Figure imgb0025
Xr' = dr X 1 ' = X + dl
Figure imgb0026

and for a = 0 . 5 Xr' = 0 . 5 X + dr Xl' = 0 . 5 X + dl
Figure imgb0027

Compared to conventional M / S quantization, only one quantization error is possible in R / L quantization, which is at most half as large and has no antiphase components, so that the useful signal obscures the quantization error much better.

Ausführungsbeispielembodiment

In Fig. 1 sind Encoder und Decoder als Beispiel für die Anwendung des erfinderischen Prinzips einer Mitte/Seite-Bildung nach der Quantisierung der Signale des linken und rechten Kanals dargestellt. Die Beschreibung beschränkt sich auf eine zweikanalige Übertragung und Codierung. Die gleichen Prinzipien können aber auch für eine mehrkanalige Übertragung und Codierung angewendet werden.In Fig. 1, encoders and decoders are shown as an example of the application of the inventive principle of center / page formation after the quantization of the signals of the left and right channels. The description is limited to a two-channel transmission and encoding. However, the same principles can also be applied to multi-channel transmission and coding.

Der linke (10) und rechte Kanal (20) eines Audiosignals werden zunächst aus dem Zeitbereich in den Frequenzbereich transformiert. Hierfür wird das bekannte Prinzip der gleitenden modifizierten Cosinus-Transformation (200) für beide Audiokanäle verwendet. Die Spektralwerte des linken (11) und rechten (12) Kanals werden im nächsten Schritt quantisiert. Der Quantisierer (300) wird durch eine Quantisierungssteuerung (500) gesteuert. Die Quantisierung kann, wie aus anderen Verfahren bekannt ist, durch eine Einteilung in Frequenzbänder unterstützt werden. Diese Einteilung hat den Vorteil, dass der Quantisierungsfehler an die spektralen Eigenschaften des Nutzsignals angepasst wird und dadurch für unser Gehör nicht so schnell hörbar wird. Die Quantisierung wird dabei an die Aussteuerung in dem jeweiligen Frequenzband angepasst, indem für jedes Band ein Skalierungsfaktor bestimmt wird. Die Quantisierungssteuerung nutzt für die Bestimmung der Skalierungsfaktoren den linken (10) und rechten (20) Eingangskanal. Eine Besonderheit der Quantisierungssteuerung in dem neuen Codierverfahren ist, dass für den linken und rechten Kanal der gleiche Skalierungsfaktor verwenden werden muss, um die Summen- und Differenzbildung in einem linearen Zahlenraum zu ermöglichen. Abgesehen von dieser Nebenbedingung können verschiedene bekannte Methoden zur Bestimmung der optimalen Skalierungsfaktoren eingesetzt werden [ Marina Bosi and Karlheinz Brandenburg; Introduction to Digital Audio Coding and Standards; Springer Verlag 2002 ]. Die Quantisierung erfüllt die Funktion einer verlustbehafteten Reduktion der für die Codierung benötigten Bits.The left (10) and right channel (20) of an audio signal are first transformed from the time domain into the frequency domain. For this purpose, the known principle of the sliding modified cosine transform (200) is used for both audio channels. The spectral values of the left (11) and right (12) channels are quantized in the next step. The quantizer (300) is controlled by a quantization controller (500). The quantization can, as is known from other methods, be supported by a division into frequency bands. This division has the advantage that the quantization error is adapted to the spectral properties of the useful signal and thus is not audible so quickly for our hearing. The quantization is adapted to the modulation in the respective frequency band by a band for each band Scaling factor is determined. The quantization controller uses the left (10) and right (20) input channels to determine the scaling factors. A special feature of the quantization control in the new coding method is that the same scaling factor must be used for the left and right channel in order to enable the sum and difference formation in a linear number space. Apart from this constraint, various known methods can be used to determine the optimal scaling factors [ Marina Bosi and Karlheinz Brandenburg; Introduction to Digital Audio Coding and Standards; Springer Verlag 2002 ]. The quantization fulfills the function of a lossy reduction of the bits required for the coding.

Der spektral zerlegte und quantisierte linke (12) und rechte (22) Kanal werden nun einer Mitte/Seite-Transformationsstufe (100) zur Umwandlung der Links/Rechts-Signale in Mitte/Seite-Signale zugeführt. Eine weitere Datenreduktion erfolgte in einer weiteren Stufe zur verlustlosen Codierung (400). Dieser Stufe, die beispielsweise wie in anderen Codierverfahren üblich mit einer Huffman-Codierung realisiert werden kann, werden die Mitte- (40) und Seite-Signale(50) sowie die Skalierungsfaktoren (60) zugeführt. Das Ergebnis ist das codierte Signal (80).The spectrally decomposed and quantized left (12) and right (22) channels are now fed to a center / side transformation stage (100) for converting left / right signals into center / side signals. Another data reduction took place in a further stage for lossless coding (400). This stage, which can be realized, for example, as usual in other coding methods with a Huffman coding, the center (40) and side signals (50) and the scaling factors (60) are supplied. The result is the coded signal (80).

Die Decodierung des codierten Signals (80) erfolgt durch Ausführung der Schritte in umgekehrter Reihenfolge. Die verlustlose Decodierung rekonstruiert die Mitte- (41) und Seite-Signale (51) sowie die Skalierungsfaktoren (61). In der nächsten Stufe (101) werden die Mitte- und Seite-Signale in linke (13) und rechte (23) quantisierte Signale zurücktransformiert. Danach erfolgt mit Hilfe der Skalierungsfaktoren (61) die inverse Quantisierung (301) zur Herstellung der ursprünglichen Werte der Spektralkoeffizienten. Die spektral zerlegten linken (14) und rechten (15) Signale werden mit der inversen modifizierten diskreten Cosinus-Transformation (201) in die rekonstruierten Signale für den linken (15) und rechten (25) Kanal zurückgesetzt.The decoding of the encoded signal (80) is done by performing the steps in reverse order. The lossless decoding reconstructs the center (41) and side signals (51) as well as the scaling factors (61). In the next stage (101), the center and side signals are transformed back to left (13) and right (23) quantized signals. Thereafter, by means of the scaling factors (61), inverse quantization (301) is carried out to produce the original values of the spectral coefficients. The spectrally decomposed left (14) and right (15) signals are reset with the inverse modified discrete cosine transform (201) to the reconstructed signals for the left (15) and right (25) channels.

Die vorliegende Erfindung zur Minimierung der Quantisierungsfehler ermöglicht in der Praxis auch, die Generierung des Bitstromes flexibler zu gestalten. Das codierte Signal (80) kann in seiner Größe (Bitrate) skaliert werden. Der Bitstrom enthält die Skalierungsfaktoren, das Mittesignal und das Seitesignal. Die Bitrate kann nun auf verschiedene Weisen reduziert werden. Zunächst können hochfrequente Anteile des Seitesignals weglassen werden. Dann können zum Beispiel die hohen Frequenzanteile des Mittensignals wegelassen werden. Die ungenutzten Skalierungsfaktoren brauchen dann auch nicht übertragen zu werden. Im nächsten Schritt könnten dann die niederfrequenten Anteile des Seitensignals reduziert werden, bis zum Beispiel das Seitesignal gar nicht mehr in dem Bitstrom vorkommt. Die Qualität der Stereoübertragung kann so Schritt für Schritt in eine Monoübertragung mit abnehmender spektraler Bandbreite übergehen.The present invention for minimizing the quantization errors also makes it possible in practice to make the generation of the bit stream more flexible. The encoded signal (80) can be scaled in size (bit rate). The bitstream contains the scaling factors, the center signal and the side signal. The bitrate can now be reduced in several ways. First, high-frequency components of the side signal can be omitted. Then, for example, the high frequency components of the center signal can be omitted. The unused scaling factors then do not need to be transmitted. In the next step, the low-frequency components of the side signal could then be reduced until, for example, the side signal no longer occurs in the bit stream. The quality of the stereo transmission can thus be transferred step by step into a mono transmission with decreasing spectral bandwidth.

Claims (3)

Verfahren zur skalierbaren Codierung von Stereo-Signalen, bei dem die Mitte/Seite-Codierung angewendet wird und die Signale des linken und rechten Kanals vor der Mitte/Seite-Verarbeitung aus dem Zeitbereich in den Frequenzbereich transformiert werden und für die Komprimierung der Daten die Signale nach der Matrizierung zur Summen- und Differenzbildung quantisiert werden,
dadurch gekennzeichnet,
dass die Signale des linken und rechten Kanals (10 und 20) nach der Transformation in den Frequenzbereich (200) separat quantisiert werden (300),
dass die Matrizierung zur Bildung der Mitte- und Seite-Signale (100) mit den bereits quantisierten Signalen des linken und rechten Kanals (12 und 22) erfolgt, und
dass die aus den quantisierten Signalen des linken und rechten Kanals gebildeten Mitte-und Seite-Signale (40 und 50) in einer weiteren Stufe der verlustlosen Codierung (400) für die Übertragung in einem codierten Signal (80) verwendet werden.
A method for scalable encoding of stereo signals, wherein the center / side encoding is applied and the left and right channel signals are transformed from the time domain to the frequency domain before the center / side processing and the signals are compressed to compress the data quantized after summation for summing and subtraction,
characterized,
that the signals of the left and right channels (10 and 20) after the transformation into the frequency domain (200) are quantized separately (300),
that the matrixing to form the center and side signals (100) with the already quantized signals of the left and right channels (12 and 22) takes place, and
that formed from the quantized signals of the left and right channel mid and side signals (40 and 50) are used in a further stage of the lossless encoding (400) for transmission in a coded signal (80).
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Quantisierung der in den Frequenzbereich transformierten Signale des linken und rechten Kanals durch eine Einteilung in Frequenzbänder unterstützt wird, dass für jedes Frequenzband ein Skalierungsfaktor bestimmt wird, dass die Skalierungsfaktoren (60) durch die Quantisierungssteuerung (500) aus den Signalen des linken (10) und rechten (20) Eingangskanals abgeleitet werden, dass die Skalierungsfaktoren für den linken und rechten Kanal identisch sein müssen, und dass die Skalierungsfaktoren zusammen mit den Mitte-und Seite-Signalen im codierten Signal übertragen werden.Method according to Claim 1, characterized in that the quantization of the signals of the left and right channels transformed into the frequency domain is supported by a division into frequency bands, that a scaling factor is determined for each frequency band that the scaling factors (60) are determined by the quantization controller (500 ) are derived from the signals of the left (10) and right (20) input channels, that the scaling factors for the left and right channels must be identical, and that the scaling factors are transmitted along with the center and side signals in the coded signal. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, dass der Bitstrom des codierten Signals flexibel gestaltet werden kann, so dass eine schrittweise Anpassung der Bitrate an die Übertragungsbedingungen in vorteilhafter Weise möglich ist.A method according to claim 1 and 2, characterized in that the bit stream of the coded signal can be made flexible, so that a stepwise adaptation of the bit rate to the transmission conditions is advantageously possible.
EP07022523A 2006-11-25 2007-11-20 Process for scaleable encoding of stereo signals Withdrawn EP1926082A1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102006055737A DE102006055737A1 (en) 2006-11-25 2006-11-25 Method for the scalable coding of stereo signals

Publications (1)

Publication Number Publication Date
EP1926082A1 true EP1926082A1 (en) 2008-05-28

Family

ID=39106071

Family Applications (1)

Application Number Title Priority Date Filing Date
EP07022523A Withdrawn EP1926082A1 (en) 2006-11-25 2007-11-20 Process for scaleable encoding of stereo signals

Country Status (3)

Country Link
US (1) US20080136686A1 (en)
EP (1) EP1926082A1 (en)
DE (1) DE102006055737A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2285025A1 (en) * 2009-07-16 2011-02-16 Alcatel Lucent Method and apparatus for coding/decoding a stereo audio signal into a mono audio signal

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009057327A1 (en) * 2007-10-31 2009-05-07 Panasonic Corporation Encoder and decoder
CN101751928B (en) * 2008-12-08 2012-06-13 扬智科技股份有限公司 Method for simplifying acoustic model analysis through applying audio frame frequency spectrum flatness and device thereof
EP2645367B1 (en) * 2009-02-16 2019-11-20 Electronics and Telecommunications Research Institute Encoding/decoding method for audio signals using adaptive sinusoidal coding and apparatus thereof
US20100331048A1 (en) * 2009-06-25 2010-12-30 Qualcomm Incorporated M-s stereo reproduction at a device
BR112012025878B1 (en) * 2010-04-09 2021-01-05 Dolby International Ab decoding system, encoding system, decoding method and encoding method.
AU2016222372B2 (en) * 2010-04-09 2018-06-28 Dolby International Ab Mdct-based complex prediction stereo coding
US11361776B2 (en) * 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030014136A1 (en) * 2001-05-11 2003-01-16 Nokia Corporation Method and system for inter-channel signal redundancy removal in perceptual audio coding
EP1400955A2 (en) * 2002-09-04 2004-03-24 Microsoft Corporation Quantization and inverse quantization for audio signals
CN1787078A (en) * 2005-10-25 2006-06-14 芯晟(北京)科技有限公司 Stereo based on quantized singal threshold and method and system for multi sound channel coding and decoding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
SG120118A1 (en) * 2003-09-15 2006-03-28 St Microelectronics Asia A device and process for encoding audio data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030014136A1 (en) * 2001-05-11 2003-01-16 Nokia Corporation Method and system for inter-channel signal redundancy removal in perceptual audio coding
EP1400955A2 (en) * 2002-09-04 2004-03-24 Microsoft Corporation Quantization and inverse quantization for audio signals
CN1787078A (en) * 2005-10-25 2006-06-14 芯晟(北京)科技有限公司 Stereo based on quantized singal threshold and method and system for multi sound channel coding and decoding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MARINA BOSI; KARLHEINZ BRANDENBURG: "Introduction to Digital Audio Coding and Standards", 2002, SPRINGER VERLAG

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2285025A1 (en) * 2009-07-16 2011-02-16 Alcatel Lucent Method and apparatus for coding/decoding a stereo audio signal into a mono audio signal

Also Published As

Publication number Publication date
DE102006055737A1 (en) 2008-05-29
US20080136686A1 (en) 2008-06-12

Similar Documents

Publication Publication Date Title
EP1926082A1 (en) Process for scaleable encoding of stereo signals
DE19628292B4 (en) Method for coding and decoding stereo audio spectral values
EP0910928B1 (en) Coding and decoding of audio signals by using intensity stereo and prediction processes
EP1864279B1 (en) Device and method for producing a data flow and for producing a multi-channel representation
EP0931386B1 (en) Method for signalling a noise substitution during audio signal coding
DE4320990B4 (en) Redundancy reduction procedure
DE60225276T2 (en) Coding device and method, decoding device and method and program
DE60206390T2 (en) EFFICIENT AND SCALABLE PARAMETRIC STEREOCODING FOR LOW-BITRATE APPLICATIONS
EP0750811B1 (en) Process for coding a plurality of audio signals
DE602004013031T2 (en) METHOD FOR CODING A DIGITAL SIGNAL INTO A SCALABLE BITSTROM, METHOD FOR DECODING A SCALABLE BITSTROM
DE69726661T2 (en) METHOD AND DEVICE FOR CODING A DIGITAL INFORMATION SIGNAL
DE69826529T2 (en) FAST DATA FRAME OPTIMIZATION IN AN AUDIO ENCODER
DE19742655C2 (en) Method and device for coding a discrete-time stereo signal
DE10200653B4 (en) Scalable encoder, encoding method, decoder and decoding method for a scaled data stream
WO2007131564A1 (en) Information signal coding
EP1145227A1 (en) Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal
EP0611516B1 (en) Process for reducing data in the transmission and/or storage of digital signals from several dependent channels
DE102008009024A1 (en) Apparatus and method for synchronizing multichannel extension data with an audio signal and for processing the audio signal
EP0642719B1 (en) Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
WO1988001811A1 (en) Digital coding process
DE60217612T2 (en) Method and device for coding and decoding speech signals
DE19742201C1 (en) Method of encoding time discrete audio signals, esp. for studio use
DE19735675C2 (en) Method for concealing errors in an audio data stream
DE69734613T2 (en) Coded information signal
DE4239506A1 (en) Reduced-bit-rate source coding method for digital audio signal transmission - applying neural network or fuzzy logic in all or parts of encoding and decoding procedures

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC MT NL PL PT RO SE SI SK TR

AX Request for extension of the european patent

Extension state: AL BA HR MK RS

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN WITHDRAWN

18W Application withdrawn

Effective date: 20081125

RTI1 Title (correction)

Free format text: PROCESS FOR SCALABLE ENCODING OF STEREO SIGNALS