DE602004008613T2 - TREUE OPTIMIZED CODING WITH VARIABLE FRAME LENGTH - Google Patents

TREUE OPTIMIZED CODING WITH VARIABLE FRAME LENGTH Download PDF

Info

Publication number
DE602004008613T2
DE602004008613T2 DE602004008613T DE602004008613T DE602004008613T2 DE 602004008613 T2 DE602004008613 T2 DE 602004008613T2 DE 602004008613 T DE602004008613 T DE 602004008613T DE 602004008613 T DE602004008613 T DE 602004008613T DE 602004008613 T2 DE602004008613 T2 DE 602004008613T2
Authority
DE
Germany
Prior art keywords
signal
coding
mono
subframes
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE602004008613T
Other languages
German (de)
Other versions
DE602004008613D1 (en
Inventor
Stefan Bruhn
Ingemar Johansson
Anisse Taleb
Daniel ENSTRÖM
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303501A external-priority patent/SE0303501D0/en
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of DE602004008613D1 publication Critical patent/DE602004008613D1/en
Application granted granted Critical
Publication of DE602004008613T2 publication Critical patent/DE602004008613T2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Endoscopes (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

A method of encoding multi-channel audio signals comprises generating of a first output signal (x' mono ), being encoding (38) parameters representing a main signal (x mono ). The main signal (x mono ) is a first linear combination (34) of signals (16A,16B) of at least a first and a second channel. The method further comprises generating (30) of a second output signal (p side ), being encoding parameters representing a side signal (x side ). The side signal (x side ) is a second linear combination (36) of signals (16A,16B) of at least the first and the second channel within an encoding frame. The method is characterised in that the generating of the second output signal further comprises scaling of the side signal (x side ) to an energy contour of the main signal (x mono ). A method of decoding is also presented as well as an encoder, a decoder and audio system, all according to the same basic idea.

Description

TECHNISCHES GEBIETTECHNICAL AREA

Die vorliegende Erfindung betrifft allgemein das Kodieren von Audio-Signalen und speziell das Kodieren von Viel-Kanal-Audio-Signalen.The The present invention relates generally to the coding of audio signals and especially the coding of multi-channel audio signals.

HINTERGRUNDBACKGROUND

Es besteht ein großer Bedarf am Markt für das Übertragen und Speichern von Audio-Signalen bei niedriger Bit-Rate, während hohe Audio-Qualität beibehalten wird. Besonders in Fällen, in welchen Übertragungs-Ressourcen oder Speicher begrenzt sind, ist der Betrieb bei niedriger Bit-Rate ein essentieller Kostenfaktor. Dieses ist typisch der Fall z. B. bei Strom- und Mitteilungs-Applikationen in Mobil-Kommunikations-Systemen, solchen wie GSM, UMTS oder CDMA.It there is a big one Demand on the market for the transferring and storing audio signals at low bit rate while high Audio Quality is maintained. Especially in cases in which transmission resources or memory is limited, the operation is at low bit rate an essential cost factor. This is typical of the case z. B. in power and messaging applications in mobile communication systems, such as GSM, UMTS or CDMA.

Gegenwärtig sind keine standardisierten Kodierer-Dekodierer verfügbar, bereitstellend hohe stereophone Audio-Qualität bei Bit-Raten, welche ökonomisch interessant für die Verwendung in Mobil-Kommunikations-Systemen sind. Was möglich ist mit verfügbaren Kodierern/Dekodierern, ist monophone Übertragung der Audio-Signale. In einem gewissen Maß ist auch stereophone Übertragung verfügbar. Jedoch, Bit-Raten-Begrenzungen erfordern es gewöhnlich die Stereo-Präsentation drastisch zu begrenzen.Present are no standardized encoder-decoder available, providing high stereophonic Audio Quality at bit rates, which is economical interesting for which are use in mobile communication systems. Which is possible with available Encoders / decoders, is monophonic transmission of audio signals. To some extent also stereophonic transmission available. However, bit rate limits usually require the stereo presentation drastically limit.

Der einfachste Weg, des stereophonen- oder Vielkanal-Kodierens von Audio-Signalen ist es, die Signale von verschiedenen Kanälen getrennt als individuelle und unabhängige Signale zu kodieren. Ein anderer grundsätzlicher Weg, verwendet in Stereo-FM-Funk-Übertragung, der auch Kompatibilität mit legalen Mono-Funk-Empfängern sichert, ist ein Summen- und ein Differenz-Signal der zwei involvierten Kanäle zu übertragen.Of the simplest way of stereophonic or multi-channel coding of audio signals is to the signals from different channels separated as individual and independent Encode signals. Another fundamental way, used in Stereo FM radio transmission, which also has compatibility with legal mono-radio receivers saves, a sum and a difference signal of the two channels involved is to be transmitted.

Kodierer/Dekodierer des Stands der Technik, solche wie MPEG-1/2 Layer III und MPEG-2/4 AAC verwenden so genanntes gemeinsames Stereo-Kodieren. Entsprechend dieser Technik werden die Signale der verschiedenen Kanäle gemeinsam verarbeitet, anstatt getrennt und individuell. Die beiden am meisten verwendeten Techniken der gemeinsamen Stereo-Kodierung sind bekannt als „Mitte/Seite" (M/S) Stereo-Kodierung und Intensitäts-Stereo-Kodierung, welche gewöhnlich auf Sub-Bänder der zu kodierenden Stereo- oder Vielkanal-Signale angewandt werden.Encoder / decoder of the prior art, such as MPEG-1/2 Layer III and MPEG-2/4 AAC use so-called common stereo coding. According to this technique the signals of the different channels are processed together instead of separate and individual. The two most used techniques the common stereo coding are known as "mid / side" (M / S) stereo coding and intensity stereo coding, which usually on sub-bands the stereo or multi-channel signals to be coded are used.

M/S Stereo-Kodierung ist ähnlich der beschriebenen Prozedur für Stereo-FM-Funk, in einem Sinne, dass diese die Summen- und Differenz-Signale der Kanal-Sub-Bänder kodiert und überträgt und dadurch Redundanz zwischen den Sub-Bändern ausnutzt. Die Struktur und der Betrieb eines Kodierers basierend auf M/S-Stereo-Kodierung ist beschrienen z. B. in US Patent 5,285,489 durch J. D. Johnston.M / S stereo coding is similar to the procedure described for stereo FM radio in the sense that it encodes and transmits the sum and difference signals of the channel sub-bands, thereby exploiting redundancy between the sub-bands. The structure and operation of a coder based on M / S stereo coding is described e.g. In U.S. Patent 5,285,489 by JD Johnston.

Intensitäts-Stereo-Kodierung ist andererseits fähig Stereo-Irrelevanz zu nutzen. Es überträgt die gemeinsame Intensität der Kanäle (der verschiedenen Sub-Bänder) zusammen mit einiger Ortsinformation, anzeigend, wie die Intensität unter den Kanälen verteilt ist. Intensitäts-Stereo-Kodierung liefert nur Information zur spektralen Intensität der Kanäle. Phasen-Information wird nicht transportiert. Aus diesem Grund und da die zeitliche Zwischen-Kanal-Information (genauer die Zeit-Differenz zwischen Kanälen) von größerer Psychoakustischer Relevanz ist, insbesondere bei niedrigeren Frequenzen, kann Intensitäts-Stereo-Kodierung nur bei hohen Frequenzen über etwa 2 kHz verwendet werden. Ein Intensitäts-Stereo-Kodier-Verfahren ist beschrieben z. B. in dem Europäischen Patent 04974413 durch Veldhuis et al.On the other hand, intensity stereo coding is capable of using stereo irrelevance. It transmits the common intensity of the channels (the various sub-bands) along with some location information, indicating how the intensity is distributed among the channels. Intensity stereo coding provides only information about the spectral intensity of the channels. Phase information is not transported. For this reason and because the temporal inter-channel information (more precisely, the time difference between channels) is of greater psychoacoustic relevance, especially at lower frequencies, intensity stereo coding can only be used at high frequencies above about 2 kHz. An intensity stereo coding method is described, for. B. in the European Patent 04974413 by Veldhuis et al.

Ein kürzlich entwickeltes Stereo-Kodierungs-Verfahren ist beschrieben z. B. in einer Konferenz-Veröffentlichung mit dem Titel „Binaural cue coding applied stereo and multi-channel audio compression", 112th AES convention, May 2002, Munich, Germany durch C. Faller et al. Dieses Verfahren ist ein Verfahren für parametrische Viel-Kanal-Audio-Kodierung. Das grundlegende Prinzip ist, dass auf der Seite der Kodierung die Signale von N Kanälen c1, c2, ... cn in ein Mono-Signal m kombiniert werden. Das Mono-Signal ist Audio-kodiert, unter Verwendung irgendeines konventionellen monophonen Audio-Kodierers/Dekodierers. Parallel werden Parameter aus den Kanal-Signalen abgeleitet, welche das Viel-Kanal-Bild beschreiben. Die Parameter werden kodiert und übertragen an den Dekodierer, zusammen mit dem Audio-Bit-Strom. Der Dekodierer dekodiert zuerst das Mono-Signal m' und regeneriert die Kanal-Signale c1', c2', ..., cN', basierend auf der parametrischen Beschreibung des Viel-Kanal-Bildes.One recently developed stereo coding method is described for. In a conference publication entitled "Binaural cue coding applied stereo and multi-channel audio compression ", 112th AES convention, May 2002, Munich, Germany by C. Faller et al. This method is a procedure for parametric multi-channel audio coding. The basic principle is that on the coding side the signals of N channels c1, c2, ... cn be combined into a mono signal m. The mono signal is audio encoded, using any conventional one monophonic audio encoder / decoder. In parallel, parameters are derived from the channel signals, which describe the multi-channel image. The parameters are coded and transmitted to the decoder, along with the audio bit stream. The decoder first decodes the mono signal m 'and regenerates the channel signals c1', c2 ', ..., cN' based on the parametric description of the multi-channel image.

Das Prinzip des ,Binaural Cue Coding' (BCC) besteht darin, dass es das kodierte Mono-Signal und so genannte BCC-Parameter überträgt. Die BCC-Parameter umfassen kodierte Niveau-Differenzen und Zeit-Differenzen zwischen den Kanälen für Sub-Bänder des originalen Viel-Kanal-Eingabe-Signals. Der Dekodierer erzeugt die verschiedenen Kanal-Signale wieder durch Anwenden von Niveau- und Phasen-Einstellungen pro Sub-Band, basierend auf den BCC-Parametern. Der Vorteil gegenüber z. B. M/S oder Intensitäts-Stereo ist, dass die Stereo-Information, umfassend zeitliche Zwischen-Kanal-Information mit viel geringeren Bit-Raten übertragen wird. Jedoch erfordert diese Technik hinsichtlich der Berechnung anspruchsvolle Zeit-Frequenz-Transformationen für jeden der Kanäle, sowohl im Kodierer als auch im Dekodierer.The principle of 'Binaural Cue Coding' (BCC) is that it is the encoded mono signal and so on transmits said BCC parameter. The BCC parameters include coded level differences and time differences between the channels for sub-bands of the original multi-channel input signal. The decoder re-generates the various channel signals by applying level and phase adjustments per sub-band based on the BCC parameters. The advantage over z. M / S or intensity stereo is that the stereo information comprising inter-channel temporal information is transmitted at much lower bit rates. However, this technique requires sophisticated time-frequency transforms for each of the channels in terms of computation, both in the encoder and in the decoder.

Darüber hinaus handhabt BCC nicht die Tatsache, dass eine Menge der Stereo-Information, speziell bei niedrigen Frequenzen diffus ist, das bedeutet sie kommt nicht aus irgendeiner bestimmten Richtung. Diffuse Ton-Felder existieren in beiden Kanälen einer Stereo-Aufnahme, jedoch sind diese in einem großen Ausmaß nicht in Phase in Bezug zu einander. Wenn ein Algorithmus, ein solcher wie BCC, Aufzeichnungen mit einer großen Menge von diffusen Ton-Feldern unterworfen wird, wird das reproduzierte Stereo-Bild verwirrt, springend von links nach rechts, da der BCC-Algorithmus das Signal nur in bestimmten Frequenz-Bändern nach rechts oder links einordnen kann.Furthermore BCC does not handle the fact that a lot of the stereo information, especially at low frequencies is diffuse, that means it comes not from any direction. Diffuse tone fields exist in both channels a stereo recording, but these are not to a large extent in phase in relation to each other. If an algorithm, such a like BCC, subject records with a large amount of diffuse clay fields The reproduced stereo image is confused, jumping from left to right as the BCC algorithm the signal only in certain frequency bands to the right or left can classify.

Ein mögliches Mittel um das Stereo-Signal zu kodieren und gute Wiedergabe von diffusen Ton-Feldern sicher zu stellen, ist ein Kodier-Schema sehr ähnlich zu dem im FM-Stereo-Rundfunk angewendeten zu verwenden, nämlich die Mono-Signale (Links + Rechts) und die Differenz-Signale (Links-Rechts) getrennt zu kodieren.One potential Means to encode the stereo signal and good playback of To ensure diffuse sound fields, a coding scheme is very similar to in FM stereo broadcasting used, namely the mono signals (left + right) and the difference signals (left-right) to code separately.

Eine Technik, beschrieben in US-Patent 5,434,948 durch C. E. Holt et al., verwendet eine ähnliche Technik wie in BCC für das Kodieren des Mono-Signals und der Seiten-Information. In diesem Fall besteht die Seiten-Information aus Prädiktor-Filtern und optional einem Residuum-Signal. Die Prädiktor-Filter, abgeschätzt durch einen Algorithmus der kleinsten Quadrate, wenn angewandt auf das Mono-Signal, erlauben die Vorhersage von Viel-Kanal-Audio-Signalen. Mit dieser Technik ist man fähig, Kodierung sehr niedriger Bit-Raten von Viel-Kanal-Audio-Quellen zu erreichen, jedoch auf Kosten eines Qualitäts-Abfalles, wie weiter unten diskutiert.A technique described in U.S. Patent 5,434,948 by CE Holt et al., uses a similar technique as in BCC for coding the mono signal and the page information. In this case, the page information consists of predictor filters and optionally a residual signal. The predictor filters, estimated by a least squares algorithm when applied to the mono signal, allow the prediction of multi-channel audio signals. With this technique, one is able to achieve encoding of very low bit rates from multi-channel audio sources, but at the cost of a quality drop, as discussed below.

Letztlich, für die Vollständigkeit, ist eine Technik zu erwähnen, welche für 3-D-Audio verwendet wird. Diese Technik synthetisiert die rechten und linken Kanal-Signale durch Filtern der Ton-Quellen-Signale mit sogenannten Kopfbezogenen Filtern. Jedoch erfordert diese Technik, dass die verschiedenen Ton-Quellen-Signale getrennt sind, und kann deshalb nicht generell für Stereo- oder Viel-Kanal-Kodierung angewandt werden.Ultimately, for the Completeness, is a technique to mention which for 3-D audio is used. This technique synthesizes the right one and left channel signals by filtering the audio source signals so-called head-related filters. However, this technique requires that the different sound source signals are separate, and can therefore not generally for Stereo or multi-channel coding.

ZUSAMNENFASSUNGZUSAMNENFASSUNG

Ein Problem mit bestehenden Kodier-Schemata, basierend auf dem Kodieren von Rahmen von Signalen, speziell eines Haupt-Signals und eines oder mehreren Seiten-Signale, ist, dass die Unterteilung von Audio-Information in Rahmen unattraktive Empfindungs-Artefakte erzeugen kann. Das Unterteilen der Information in Rahmen relativ langer Dauer reduziert gewöhnlich die im Durchschnitt verlangte Bit-Rate. Dieses kann vorteilhaft sein z. B. für Musik, enthaltend einen große Menge von diffusem Ton. Jedoch, für Musik, reich an Übergängen oder Sprache, werden schnelle zeitliche Variationen verschmiert werden über die Dauer des Rahmens, verursachend gespensterhafte Töne oder auch Vor-Echo-Probleme. Das Kodieren kurzer Rahmen wird statt dessen eine genauere Präsentation des Tons ergeben, minimierend die Energie, erfordert aber höhere Übertragungs-Bit-Raten und größere Berechnungs-Kapazitäten. Die Kodierungs-Effizienz als solche kann sich mit sehr kurzen Rahmen-Längen auch verringern. Die Einführung von mehr Rahmen-Grenzen kann auch Diskontinuitäten in Kodier-Parametern einführen, welche als Wahrnehmungs-Artefakte erscheinen können.One Problem with existing coding schemes based on coding of frames of signals, especially a main signal and one or more side signals, is that the subdivision of audio information in frame unattractive Can produce sensation artifacts. Dividing the information in a relatively long duration usually reduces the average demanded bit rate. This can be advantageous for. For music, containing a large one Amount of diffused clay. However, for music, rich in transitions or Language, fast temporal variations will be smeared over the Duration of the frame, causing ghostly sounds or also pre-echo problems. Encoding short frames will instead be a more accurate presentation of the sound, minimizing the energy but requiring higher transmission bit rates and larger calculation capacities. The Encoding efficiency as such can vary with very short frame lengths as well reduce. The introduction more frame boundaries may also introduce discontinuities in encoding parameters can appear as perceptual artifacts.

Ein weiteres Problem mit Schemata, basierend auf dem Kodieren eines Haupt-Signals und eines oder einiger Seiten-Signale ist, dass diese häufig relativ große Berechnungs-Kapazitäten erfordern. Insbesondere, wenn kurze Rahmen verwendet werden, ist das Handhaben von Diskontinuitäten in den Parametern von einem Rahmen zu einem anderen eine komplexe Aufgabe. Wenn lange Rahmen verwendet werden, können Abschätzungs-Fehler von Ton-Übergängen sehr große Seiten-Signale verursachen, welche wiederum den Bedarf an Übertragungs-Rate erhöhen.One Another problem with schemes based on coding a Main signal and one or more side signals is that these often relatively large Calculation capacity require. In particular, when short frames are used is managing discontinuities in the parameters from one frame to another a complex one Task. When long frames are used, estimation errors of tone transitions can be very high size Cause side signals, which in turn reduces the need for transmission rate increase.

Ein Ziel der vorliegenden Erfindung ist es daher, ein Kodier-Verfahren und eine Vorrichtung bereitzustellen, verbessernd die Wahrnehmungs-Qualität von Viel-Kanal-Audio-Signalen, insbesondere um Artefakte zu vermeiden, solche wie Vor-Echo, gespensterhafte Töne oder Rahmen-Diskontinuitäts-Artefakte. Ein weiteres Ziel der vorliegenden Erfindung ist es, ein Kodier-Verfahren und eine Vorrichtung bereitzustellen, welche geringere Verarbeitungs-Leistung erfordern und konstantere Übertragungs-Bit-Raten-Anforderungen haben.One The aim of the present invention is therefore to provide a coding method and a Device to improve the perceptual quality of multi-channel audio signals, especially to avoid artifacts, such as pre-echo, ghostly Sounds or Frame discontinuity artefacts. Another object of the present invention is an encoding method and to provide a device which has lower processing power require and more constant transmission bit rate requirements to have.

Die obigen Ziele werden erreicht durch Verfahren und Vorrichtungen entsprechend den anhängenden Patentansprüchen. Allgemein ausgedrückt: Polyphone Signale werden verwendet, um ein Haupt-Signal, typisch ein Mono-Signal, und ein Seiten-Signal zu erzeugen. Das Haupt-Signal wird entsprechend zu Kodier-Prinzipien des Stands der Technik kodiert. Eine Anzahl von Kodier-Schemata für das Seiten-Signal wird bereitgestellt. Jedes Kodier-Schema ist gekennzeichnet durch eine Gruppe von Unter-Rahmen verschiedener Längen. Die gesamte Länge der Unter-Rahmen korrespondiert zu der Länge des Kodier-Rahmens des Kodier-Schemas. Die Gruppen von Unter-Rahmen umfassen zumindest einen Unter-Rahmen. Das für das Seiten-Signal zu verwendende Kodier-Schema wird ausgewählt, zumindest teilweise abhängig von dem gegenwärtigen Signal-Inhalt der polyphonen Signale.The The above objects are achieved by methods and devices accordingly the appended claims. Generally words Polyphonic signals are used to produce a main signal, typical a mono signal, and a side signal to create. The main signal becomes according to coding principles of the prior art coded. A number of coding schemes for the Page signal is provided. Each coding scheme is marked by a group of sub-frames of different lengths. The whole length the sub-frame corresponds to the length of the coding frame of the Coding scheme. The groups of subframes include at least one subframe. That for the encoding scheme to be used for the page signal is selected, at least partially dependent from the present Signal content of the polyphonic signals.

In einer Ausführungsform findet die Auswahl vor dem Kodieren statt, basierend auf Analyse der Signal-Eigenschaften. In einer anderen Ausführungsform wird das Seiten-Signal kodiert durch jedes der Kodier-Schemata und dann wird basierend auf Messungen der Qualität der Kodierung das beste Kodier-Schema ausgewählt.In an embodiment the selection takes place before coding, based on analysis the signal properties. In another embodiment, the page signal encoded by each of the coding schemes and then being based on quality measurements coding the best coding scheme selected.

In einer bevorzugten Ausführungsform wird ein Residuum-Signal erzeugt als eine Differenz zwischen dem Seiten-Signal und dem mit einem Abgleich/Ausgleichs-Faktor skalierten Haupt-Signal. Der Abgleich/Ausgleichs-Faktor wird ausgewählt, um das Seiten-Residuum-Signal zu minimieren. Das optimierte Seiten-Residuum-Signal und der Abgleich/Ausgleichs-Faktor werden kodiert und als das Seiten-Signal repräsentierende Parameter bereitgestellt. Auf der Dekodierer-Seite werden der Abgleich/Ausgleichs-Faktor, das Seiten-Residuum-Signal und das Haupt-Signal verwendet, um das Seiten-Signal wieder herzustellen.In a preferred embodiment a residual signal is generated as a difference between the Page signal and the scaled with a balance / compensation factor Main signal. The balance / compensation factor is selected to to minimize the page residual signal. The optimized side residual signal and the adjustment / compensation factor is encoded and called the page signal representing parameters provided. On the decoder side, the balance / equalization factor, the side residual signal and the main signal used to get that Restore page signal.

In einer weiteren bevorzugten Ausführungsform umfasst das Kodieren des Seiten-Signals eine Energie-Kontur-Skalierung, um Vor-Echo-Effekte zu vermeiden. Außerdem können unterschiedliche Kodier-Schemata unterschiedliche Kodier-Prozeduren in den getrennten Unter-Rahmen umfassen.In a further preferred embodiment Encoding the side signal includes energy contour scaling to avoid pre-echo effects. You can also use different coding schemes different coding procedures in the separate sub-frames.

Der Haupt-Vorteil der vorliegenden Erfindung ist, dass die Erhaltung der Wahrnehmung/Empfindung der Audio-Signale verbessert ist. Außerdem erlaubt die vorliegende Erfindung auch die Übertragung von Viel-Kanal-Signalen bei sehr niedrigen Bit-Raten.Of the Main advantage of the present invention is that the conservation the perception / sensation of the audio signals is improved. Also allowed the present invention also involves the transmission of multi-channel signals at very low bit rates.

KURZE BESCHREIBUNG DER ZEICHNUNGENBRIEF DESCRIPTION OF THE DRAWINGS

Die Erfindung, zusammen mit deren weiteren Zielen und Vorteilen, kann am besten verstanden werden durch Bezugnahme af die folgende Beschreibung, genommen zusammen mit den begleitenden Zeichnungen, in welchen:The Invention, together with its other objectives and advantages, can are best understood by reference to the following description, taken together with the accompanying drawings, in which:

1 ein Block-Schema eines Systems für das Übertragen polyphoner Signale zeigt; 1 shows a block diagram of a system for transmitting polyphonic signals;

2a ein Block-Diagramm eines Kodierers in einem Sender ist; 2a a block diagram of an encoder in a transmitter;

2b ein Block-Diagramm eines Dekodierers in einem Empfänger ist; 2 B a block diagram of a decoder in a receiver;

3a ein Diagramm, illustrierend Kodier-Rahmen verschiedener Länge ist; 3a Figure 11 is a diagram illustrating coding frames of various lengths;

3b und 3c Block-Diagramme von Ausführungsformen von Seiten-Signal-Kodier-Einheiten entsprechend der vorliegenden Erfindung sind; 3b and 3c Block diagrams of embodiments of page signal encoding units according to the present invention are;

4 ein Block-Diagramm einer Ausführungsform eines Kodierers, verwendend Abgleich/Ausgleich-Faktor-Kodierung des Seiten-Signals, ist; 4 Fig. 12 is a block diagram of one embodiment of an encoder using adjustment / compensation factor coding of the side signal;

5 ein Block-Diagramm einer Ausführungsform eines Kodierers für Viel-Kanal-Systeme ist; 5 Figure 12 is a block diagram of one embodiment of a multi-channel system encoder;

6 ein Block-Diagramm einer Ausführungsform eines Kodierers, geeignet für das Dekodieren der Signale aus der Vorrichtung der 5, ist; 6 a block diagram of an embodiment of an encoder, suitable for decoding the signals from the device of 5 , is;

7a und 7b Diagramme, illustrierend Vor-Echo-Artefakte, sind; 7a and 7b Charts, illustrating pre-echo artifacts, are;

8 ein Block-Diagramm einer Ausführungsform einer Seiten-Signal-Kodier-Einheit entsprechend der vorliegenden Erfindung, einsetzend verschiedene Kodier-Prinzipien in verschiedenen Unter-Rahmen, ist; 8th a block diagram of one embodiment of a page signal encoding unit according to the present invention employing different coding principles in different subframes;

9 die Verwendung von verschiedenen Kodier-Prinzipien in verschiedenen Frequenz-Sub-Bändern illustriert; 9 illustrates the use of different coding principles in different frequency sub-bands;

10 ein Fluss-Diagramm der grundlegenden Schritte einer Ausführungsform eines Kodier-Verfahrens entsprechend der vorliegenden Erfindung ist; und 10 Fig. 10 is a flow chart of the basic steps of one embodiment of a coding method according to the present invention; and

11 ein Fluss-Diagramm der grundlegenden Schritte einer Ausführungsform eines Dekodier-Verfahrens entsprechend der vorliegenden Erfindung ist. 11 Fig. 10 is a flow chart of the basic steps of one embodiment of a decoding method according to the present invention.

DETAILLIERTE BESCHREIBUNGDETAILED DESCRIPTION

1 illustriert ein typisches System 1, in welchem die vorliegende Erfindung vorteilhaft verwendet werden kann. Ein Sender 10 enthält eine Antenne 12, einschließend assoziierte Hardware und Software, um fähig zu sein Funk-Signale 5 an einen Empfänger 20 zu senden. Der Sender 10 enthält unter anderen Teilen einen Viel-Kanal-Kodierer 14, welcher die Signale einer Anzahl von Eingabe-Kanälen 16 in Ausgabe-Signale, geeignet für Funk-Übertragung, transformiert. Beispiele von geeigneten Viel-Kanal-Kodierern 14 werden weiter unten im Detail beschrieben. Die Signale der Eingabe-Kanäle 16 können z. B. von einem Audio-Signal-Speicher 18, einem solchen wie einer Daten-Datei der digitalen Repräsentation von Audio-Aufzeichnungen, von Magnetband- oder Vinyl-Scheiben-Aufzeichnungen von Audio etc. geliefert werden. Die Signale der Eingabe-Kanäle 16 können auch „Live", z. B. aus einer Gruppe von Mikrophonen 19 geliefert werden. Die Audio-Signale sind digitalisiert, wenn nicht bereits in digitaler Form, bevor diese in den Viel-Kanal-Kodierer 14 eintreten. 1 illustrates a typical system 1 in which the present invention can be used to advantage. A transmitter 10 contains an antenna 12 Including associated hardware and software to be able to transmit radio signals 5 to a receiver 20 to send. The transmitter 10 contains among other parts a multi-channel encoder 14 representing the signals of a number of input channels 16 in output signals, suitable for radio transmission, transformed. Examples of suitable multi-channel encoders 14 will be described in detail below. The signals of the input channels 16 can z. B. from an audio signal memory 18 , such as a data file of the digital representation of audio recordings, of magnetic tape or vinyl-disk recordings of audio, etc. The signals of the input channels 16 can also be "live", for example from a group of microphones 19 to be delivered. The audio signals are digitized, if not already in digital form, before those in the multi-channel coder 14 enter.

Auf der Seite des Empfängers 20 handhabt eine Antenne 22 mit assoziierter Hardware und Software den tatsächlichen Empfang von Funk-Signalen 5, repräsentierend polyphone Audio-Signale. Hier werden typische Funktionalitäten, solche wie Fehler-Korrektur ausgeführt. Ein Dekodierer 24 dekodiert die empfangenen Funk-Signale 5 und transformiert die durch diese transportierten Audio-Daten in Signale einer Anzahl von Ausgabe-Kanälen 26. Die Ausgabe-Signale können geliefert werden z. B. an Lautsprecher 29 für sofortige Präsentation oder können in einem Audio-Signal-Speicher 28 beliebiger Art gespeichert werden.On the side of the recipient 20 handles an antenna 22 with associated hardware and software, the actual reception of radio signals 5 representing polyphonic audio signals. Typical functions, such as error correction, are executed here. A decoder 24 decodes the received radio signals 5 and transforms the audio data transported thereby into signals of a number of output channels 26 , The output signals can be supplied e.g. B. to speakers 29 for instant presentation or can be in an audio signal memory 28 be stored of any kind.

Das System 1 kann zum Beispiel ein Telefon-Konferenz-System, ein System für das Bereitstellen von Audio-Diensten oder anderen Audio-Applikationen sein. In einigen Systemen, solchen wie z. B. dem Telefon-Konferenz-System, muss die Kommunikation von einem Duplex-Typ sein, während z. B. die Verteilung von Musik von einem Dienst-Bereitsteller an einen Dienst-Abnehmer im Wesentlichen vom Ein-Weg-Typ sein kann. Die Übertragung von Signalen von dem Sender 10 an den Empfänger 20 kann auch durch irgendwelche anderen Mittel, z. B. unterschiedliche Arten von elektromagnetischen Wellen, Kabel oder Fasern, wie auch durch Kombinationen von diesen ausgeführt werden.The system 1 may be, for example, a telephone conference system, a system for providing audio services or other audio applications. In some systems, such as. As the telephone conference system, the communication must be of a duplex type, while z. For example, the distribution of music from a service provider to a service customer may be essentially one-way. The transmission of signals from the transmitter 10 to the recipient 20 can also by any other means, for. As different types of electromagnetic waves, cables or fibers, as well as by combinations of these are performed.

2a illustriert eine Ausführungsform eines Kodierers entsprechend der vorliegenden Ausführungsform. In dieser Ausführungsform ist das polyphone Signal ein Stereo-Signal, umfassend zwei Kanäle a und b, empfangen jeweils an den Eingängen 16A und 16B. Die Signale der Kanäle a und b werden an ein Vorverarbeitungs-Einheit 32 geliefert, in welcher verschiedene Signal-Konditionierungs-Prozeduren ausgeführt werden können. Die (vielleicht modifizierten) Signale aus der Ausgabe der Vorverarbeitungs-Einheit 32 werden in der Addier-Einheit 34 summiert. Diese Addier-Einheit 34 teilt auch die Summe durch einen Faktor 2. Das in dieser Weise erzeugte Signal xmono ist ein Haupt-Signal des Stereo-Signals, da es im Wesentlichen alle Daten von beiden Kanälen umfasst. In dieser Ausführungsform repräsentiert das Haupt-Signal daher ein reines „mono"-Signal. Das Haupt-Signal xmono wird an eine Haupt-Signal-Kodier-Einheit 38 geliefert, welche das Haupt-Signal entsprechend zu irgendwelchen geeigneten Kodier-Prinzipien kodiert. Solche Prinzipien sind innerhalb des Stands der Technik verfügbar und werden deshalb hier nicht weiter diskutiert. Die Haupt-Signal-Kodier-Einheit 38 liefert ein Ausgabe-Signal pmono, bestehend aus ein Haupt-Signal repräsentierenden Kodier-Parametern. 2a illustrates an embodiment of an encoder according to the present embodiment. In this embodiment, the polyphonic signal is a stereo signal comprising two channels a and b, received at the inputs, respectively 16A and 16B , The signals of channels a and b are sent to a preprocessing unit 32 delivered, in which various signal conditioning procedures can be performed. The (perhaps modified) signals from the output of the preprocessing unit 32 be in the adder unit 34 summed. This adder unit 34 also divides the sum by a factor 2. The signal x mono generated in this way is a main signal of the stereo signal, since it comprises substantially all data from both channels. Therefore, in this embodiment, the main signal represents a pure "mono" signal, and the main signal x mono is sent to a main signal encoding unit 38 which encodes the main signal according to any suitable coding principles. Such principles are available within the state of the art and therefore will not be discussed further here. The main signal coding unit 38 provides an output signal p mono consisting of coding parameters representing a main signal.

In einer Subtraktions-Einheit 36 wird eine Differenz (geteilt durch einen Faktor 2) der Kanal-Signale als ein Seiten-Signal xside bereitgestellt. In dieser Ausführungsform repräsentiert das Seiten-Signal die Differenz zwischen den beiden Kanälen des Stereo-Signals. Das Seiten-Signal xside wird an eine Seiten-Signal-Kodier-Einheit 30 geliefert. Bevorzugte Ausführungsformen der Seiten-Signal-Kodier-Einheit 30 werden weiter unten diskutiert werden. Entsprechend einer Seiten-Signal-Kodier-Prozedur, welche in größerem Detail weiter unten beschrieben werden wird, wird das Seiten-Signal xside in die Kodier-Parameter pside, repräsentierend ein Seiten-Signal xside, übergeführt. In bestimmten Ausführungsformen findet dieses Kodieren auch unter Verwendung der Information des Haupt-Signals xmono statt. Der Pfeil 42 zeigt eine solche Einrichtung, bei welcher das originale nicht kodierte Signal xmono verwendet wird. In weiteren andersartigen Ausführungsformen kann die Haupt-Signal-Information, welche in der Seiten-Signal-Kodier-Einheit 30 verwendet wird, aus den Kodier-Parametern pmono, repräsentierend das Haupt-Signal, abgeleitet werden, wie durch die unterbrochene Linie 44 angezeigt.In a subtraction unit 36 For example, a difference (divided by a factor of 2) of the channel signals is provided as a side signal x side . In this embodiment, the side signal represents the difference between the two channels of the stereo signal. The page signal x side is sent to a page signal encoding unit 30 delivered. Preferred embodiments of the side signal coding unit 30 will be discussed below. In accordance with a page signal encoding procedure, which will be described in more detail below, the page signal x side is converted to the encode parameters p side representing a page signal x side . In certain embodiments, this coding also takes place using the information of the main signal x mono . The arrow 42 shows such a device in which the original unencoded signal x mono is used. In other different embodiments, the main signal information contained in the page signal encoding unit 30 is derived from the coding parameters p mono representing the main signal, as deduced by the broken line 44 displayed.

Die Kodierungs-Parameter pmono, repräsentierend das Haupt-Signal xmono, sind ein erstes Ausgabe-Signal und die Kodierungs-Parameter pside repräsentieren das Seiten-Signal xside in einem zweiten Ausgabe-Signal. In einem typischen Fall werden diese zwei Ausgabe-Signale pmono, pside, zusammen den vollen Stereo-Ton repräsentierend, in ein Übertragungs-Signal 52 in einer Multiplexer-Einheit 40 gemultiplext. Jedoch kann in anderen Ausführungsformen die Übertragung der ersten und zweiten Ausgabe-Signale pmono, pside getrennt stattfinden.The coding parameters p mono representing the main signal x mono are a first output signal and the coding parameters p side represent the side signal x side in a second output signal. In a typical case, these two output signals p mono , p side , together representing the full stereo sound, become a transmission signal 52 in a multiplexer unit 40 multiplexed. However, in other embodiments, the transmission of the first and second output signals p mono , p side may take place separately.

In 2b ist eine Ausführungsform eines Dekodierers 24 entsprechend der vorliegenden Erfindung als ein Block-Schema illustriert. Das empfangene Signal 54, enthaltend Kodier-Parameter repräsentierend die Haupt-Signal- und Seiten-Signal-Information, wird an eine Demultiplexer-Einheit 56 geliefert, welche jeweils ein erstes und ein zweites Eingabe-Signal trennt. Das erste Eingabe-Signal, korrespondierend zu den Kodier-Parametern pmono eines Haupt-Signals, wird an eine Haupt-Signal-Dekodier-Einheit 64 geliefert. In einer konventionellen Weise werden die Kodier-Parameter pmono, repräsentierend das Haupt-Signal, verwendet, um ein dekodiertes Haupt-Signal x''mono zu erzeugen, welches so ähnlich wie möglich dem Haupt-Signal xmono (2a) des Kodierers 14 (2a) ist.In 2 B is an embodiment of a decoder 24 illustrated as a block scheme according to the present invention. The received signal 54 comprising coding parameters representing the main signal and side signal information, is sent to a demultiplexer unit 56 which separates a first and a second input signal, respectively. The first input signal, corresponding to the coding parameters p mono of a main signal, is sent to a main signal decoding unit 64 delivered. In a conventional manner, the coding parameters p mono representing the main signal are used to mono generate a decoded main signal x "which is as similar as possible to the main signal x mono ( 2a ) of the encoder 14 ( 2a ).

Ähnlich wird das zweite Eingabe-Signal, korrespondierend zu einem Seiten-Signal, an eine Seiten-Signal-Dekodier-Einheit 60 geliefert. Hier werden die Kodier-Parameter pside, repräsentierend das Seiten-Signal, verwendet, um das dekodierte Seiten-Signal x''side wiederherzustellen. In einigen Ausführungsformen verwendet die Dekodier-Prozedur Information über das Haupt-Signal x''mono, wie durch den Pfeil 65 angezeigt.Similarly, the second input signal corresponding to a page signal is sent to a page signal decoder unit 60 delivered. Here, the encode parameters p side representing the page signal are used to restore the decoded side signal x " side . In some embodiments, the decoding procedure uses information about the main signal x " mono , as indicated by the arrow 65 displayed.

Die dekodierten Haupt- und Seiten-Signale x''mono und x''side werden an eine Addier-Einheit 70 geliefert, welche ein Ausgabe-Signal bereitstellt, welches eine Repräsentation des originalen Signals des Kanals a ist, Ähnlich liefert eine durch eine Subtraktions-Einheit 68 bereitgestellte Differenz ein Ausgabe-Signal, welches eine Repräsentation des originalen Signals des Kanals b ist. Diese Kanal-Signale können nach-verarbeitet werden in einer Nach-Verarbeitungs-Einheit 74 entsprechend zu Signal-Verarbeitungs-Prozeduren des Stands der Technik. Letztlich werden die Kanal-Signale a und b an den Ausgängen 26A und 26B des Dekodierers bereitgestellt.The decoded main and side signals x " mono and x" side are sent to an adder unit 70 which provides an output signal which is a representation of the original signal of channel a, similarly provides one by a subtraction unit 68 provided difference an output signal, which is a representation of the original signal of the channel b. These channel signals can be post-processed in a post-processing unit 74 according to signal processing procedures of the prior art. Finally, the channel signals a and b at the outputs 26A and 26B provided by the decoder.

Wie in der Zusammenfassung erwähnt, wird das Kodieren typisch zu einer Zeit in einem Rahmen ausgeführt. Ein Rahmen enthält Audio-Abtastungen(Samples) innerhalb einer vordefinierten Zeitspanne. In dem unteren Teil der 3a ist ein Rahmen SF2 der Zeit-Dauer L illustriert. Die Audio-Abtastungen innerhalb des nicht gestrichelten Bereichs sind zusammen zu kodieren. Die vorangehenden und die nachfolgenden Abtastungen werden in anderen Rahmen kodiert. Die Aufteilung der Abtastungen in Rahmen wird auf jeden Fall einige Diskontinuitäten an den Rahmen-Grenzen erzeugen. Das Verschieben von Tönen wird das Verschieben von Kodier-Parametern ergeben, welche sich grundsätzlich an jeder Rahmen-Grenze verändern. Dieses wird Anlass für wahrnehmbare Fehler geben. Ein Weg, um dieses etwas zu kompensieren ist, das Kodieren nicht nur auf die zu kodierenden Abtastungen zu basieren, sondern auch auf Abtastungen in der direkten Nachbarschaft des Rahmens, wie durch die gestrichelten Bereiche angezeigt. Auf diese Weise wird es einen sanfteren Übergang zwischen den verschiedenen Rahmen geben. Als eine Alternative oder Ergänzung werden manchmal auch Interpolations-Techniken für das Verringern von durch Rahmen-Grenzen verursachten Wahrnehmungs-Artefakten verwendet. Jedoch, alle diese Prozeduren erfordern große zusätzliche Berechnungs-Ressourcen und für bestimmte spezielle Dekodier-Techniken kann es auch schwer sein irgendwelche Ressourcen bereitzustellen.As mentioned in the summary, coding is typically performed at one time in a frame. A frame contains audio samples within a predefined period of time. In the lower part of the 3a a frame SF2 of the time duration L is illustrated. The audio samples within the non-dashed area are to be coded together. The preceding and following samples are encoded in different frames. The division of samples into frames will definitely create some discontinuities at the frame boundaries. Moving sounds will result in shifting of coding parameters which basically change at each frame boundary. This will give rise to perceptible errors. One way to compensate for this is to base the coding not only on the samples to be coded, but also on samples in the immediate vicinity of the frame, as indicated by the dashed areas. In this way, there will be a smoother transition between the different frames. As an alternative or supplement, interpolation techniques are sometimes used to reduce perceptual artifacts caused by framing boundaries. However, all of these procedures require large additional computational resources, and for certain special decoding techniques, it may also be difficult to provide any resources.

Angesichts dessen ist es vorteilhaft möglichst lange Rahmen zu verwenden, da dann die Anzahl der Rahmen-Grenzen klein sein wird. Auch wird die Kodier-Effizienz typisch hoch und die erforderliche Übertragungs-Bit-Rate wird typisch minimiert sein. Jedoch lange Rahmen ergeben Probleme mit Vor-Echo-Artefakten und gespensterhaften Tönen.in view of it is advantageous as possible to use long frames, since then the number of frame boundaries will be small. Also, the coding efficiency is typically high and high the required transmission bit rate will typically be minimized. However, long frames result in problems with pre-echo artifacts and ghostly tones.

Werden statt dessen kürzere Rahmen verwendet, solche wie SF1 oder sogar SF0, aufweisend die Zeitdauer jeweils von L/2 und L/4, wird jeder mit dem Gebiet Vertraute erkennen, dass die Kodier-Effizienz verringert sein kann, die Übertragungs-Bit-Rate höher zu sein hat und die Probleme mit Rahmen-Grenzen-Artefakten wachsen werden. Jedoch, kürzere Rahmen leiden weniger unter anderen Wahrnehmungs-Artefakten, solchen wie gespensterhaften Tönen und Vor-Echo. Um den Kodier-Fehler so gut wie möglich zu minimieren, sollte man eine Rahmen-Länge, so kurz wie möglich wählen.If, instead, shorter frames are used, such as SF1 or even SF0, having the time periods of L / 2 and L / 4, respectively, anyone familiar with the art will recognize that the coding efficiency can be reduced, the transmission bit rate is higher and the problems with frame boundary artifacts will grow. However, shorter frames suffer less from other perceptual artifacts, such as ghostly sounds and pre-echo. To minimize the coding error as much as possible, you should choose a frame length as short as possible.

Entsprechend der vorliegenden Erfindung wird die Audio-Wahrnehmung verbessert durch Verwenden einer Rahmen-Länge für das Kodieren des Seiten-Signals, welche abhängig ist von dem gegenwärtig vorhandenen Signal-Inhalt. Da der Einfluss verschiedener Rahmen-Längen auf die Audio-Wahrnehmung verschieden sein wird, abhängig von der Natur der zu kodierenden Töne, kann eine Verbesserung dadurch erreicht werden, dass der Natur des Signals selbst erlaubt wird die verwendete Rahmen-Länge zu beeinflussen. Das Kodieren des Haupt-Signals ist nicht Gegenstand der vorliegenden Erfindung und wird daher nicht im Detail beschrieben. Jedoch können die für das Kodieren des Haupt-Signals verwendeten Rahmen-Längen gleich oder nicht gleich sein zu den für das Kodieren des Seiten-Signals verwendeten Rahmen-Längen.Corresponding In the present invention, the audio perception is improved by using a Frame length for the Encoding the page signal, which depends on the currently available one Signal content. Because the influence of different frame lengths on the audio perception will be different, depending on the nature of the coded Sounds, can An improvement can be achieved by the nature of the signal itself is allowed to influence the frame length used. Coding the Main signal is not the subject of the present invention and is therefore not described in detail. However, those for coding the main signal used frame lengths equal to or not equal to those for encoding the page signal used frame lengths.

Wegen kleiner zeitlicher Veränderungen kann es in einigen Fällen nützlich sein, das Seiten-Signal unter Verwendung relativ langer Rahmen zu kodieren. Dieses kann der Fall sein bei Aufzeichnungen mit einer großen Menge von diffusem Ton-Feld, solchen wie Konzert-Aufzeichnungen. In anderen Fällen, solchen wie Stereo-Sprach-Konversation, sind wahrscheinlich kurze Rahmen zu bevorzugen. Die Entscheidung, welche Rahmen-Länge zu bevorzugen ist kann auf zwei grundlegende Arten getroffen werden.Because of small temporal changes It can in some cases useful be, the side signal using relatively long frame to encode. This can be the case with records with a large amount of diffuse clay field, such as concert records. In other cases, such as stereo-voice conversation, are probably short frames to prefer. The decision, which frame length to prefer is can be met in two basic ways.

Eine Ausführungsform einer Seiten-Signal-Kodier-Einheit 30 entsprechend der vorliegenden Erfindung ist in 3b illustriert, in welcher eine Endlos-Schleifen-Entscheidung verwendet ist. Ein elementarer Kodier-Rahmen der Länge L wird hier verwendet. Eine Anzahl von Kodier-Schemata 81, gekennzeichnet durch eine getrennte Gruppe 80 von Unter-Rahmen 90, werden erzeugt. Jede Gruppe 80 von Unter-Rahmen 90 enthält ein oder mehrere Unter-Rahmen 90 von gleicher oder unterschiedlicher Länge. Die gesamte Länge der Gruppe 80 von Unter-Rahmen 90 ist jedoch immer gleich der elementaren Kodier-Rahmen-Länge L. Mit Bezugnahmen zu 3b ist das oberste Kodier-Schema gekennzeichnet durch eine Gruppe von Unter-Rahmen, welche nur einen Unter-Rahmen der Länge L enthalten. Die nächste Gruppe von Unter-Rahmen enthält zwei Rahmen der Länge L/2. Die dritte Gruppe enthält zwei Rahmen der Länge L/4, gefolgt durch einen L/2-Rahmen.An embodiment of a page signal encoding unit 30 according to the present invention is in 3b illustrated in which an infinite loop decision is used. An elementary coding frame of length L is used here. A number of coding schemes 81 , characterized by a separate group 80 from sub-frame 90 , are generated. Every group 80 from sub-frame 90 contains one or more sub-frames 90 of equal or different length. The entire length of the group 80 from sub-frame 90 is however always equal to the elementary coding frame length L. With references to 3b For example, the uppermost coding scheme is characterized by a group of subframes containing only one subframe of length L. The next group of sub-frames contains two frames of length L / 2. The third group contains two frames of length L / 4, followed by an L / 2 frame.

Das Signal xside, geliefert an die Seiten-Signal-Kodier-Einheit 30 wird durch alle Kodier-Schemata 81 kodiert. In dem obersten Kodier-Schema wird der ganze elementare Rahmen in einem Stück kodiert. Jedoch, in den anderen Schemata wird das Signal xside in jedem Unter-Rahmen getrennt von einander kodiert. Das Ergebnis aus jedem Kodier-Schema wird an einen Auswähler 85 geliefert. Ein Wiedergabetreue-Mess-Mittel 83 bestimmt ein Wiedergabetreue-Maß für jedes der kodierten Signale. Das Wiedergabetreue-Maß ist ein objektiver Qualitäts-Wert, bevorzugt ein Signal-zu-Rauschen-Maß oder ein gewichtetes Signal-zu-Rauschen-Verhältnis. Die Wiedergabetreue-Messungen, verbunden mit jedem Kodier-Schema, werden verglichen und das Ergebnis steuert ein Schalt-Mittel 87, um die kodierten Parameter, repräsentierend das Seiten-Signal aus dem Kodier-Schema, welches das beste Wiedergabetreue-Maß ergeben hat, als das Ausgabe-Signal pside aus der Seiten-Signal-Kodierer-Einheit 30 auszuwählen.The signal x side , supplied to the side signal coding unit 30 is through all coding schemes 81 coded. In the top encoding scheme, the entire elementary frame is encoded in one piece. However, in the other schemes, the signal x side in each subframe is coded separately from each other. The result from each coding scheme is sent to a selector 85 delivered. A fidelity measuring means 83 determines a fidelity measure for each of the encoded signals. The fidelity measure is an objective quality value, preferably a signal-to-noise measure or a weighted signal-to-noise ratio. The fidelity measurements associated with each coding scheme are compared and the result controls a switching means 87 to the coded parameters representing the page signal from the coding scheme which has given the best fidelity measure, as the output signal p side from the page signal encoder unit 30 select.

Bevorzugt werden alle möglichen Kombinationen von Rahmen-Längen geprüft und die Gruppe von Unter-Rahmen, welche die beste objektive Qualität ergibt, z. B. Signal-zu-Rauschen-Verhältnis, wird gewählt.Prefers be all possible Combinations of frame lengths tested and the Group of sub-frames that gives the best objective quality, z. As signal-to-noise ratio is selected.

In der vorliegenden Ausführungsform werden die Längen der verwendeten Unter-Rahmen ausgewählt entsprechend zu:

Figure 00150001
wobei lsf die Längen der Unter-Rahmen, lf die Länge des Kodier-Rahmens und n ein Integer ist. In der vorliegenden Ausführungsform wird n zwischen 0 und 3 gewählt, es wird möglich sein irgendeine Rahmen-Länge zu verwenden, so lange wie die gesamte Länge der Gruppe konstant gehalten wird.In the present embodiment, the lengths of the sub-frames used are selected according to:
Figure 00150001
where l sf is the lengths of the subframes, l f is the length of the encoding frame, and n is an integer. In the present embodiment, n is selected between 0 and 3, it will be possible to use any frame length as long as the entire length of the group is kept constant.

In 3c ist eine andere Ausführungsform einer Seiten-Signal-Kodierer-Einheit 30 entsprechend der vorliegenden Erfindung illustriert. Hier ist die Entscheidung der Rahmen-Länge eine Endlos-Schleifen-Entscheidung, basierend auf der Statistik des Signals. In anderen Worten, die spektralen Eigenschaften des Seiten-Signals werden verwendet als eine Basis für das Entscheiden, welches Kodier-Schema zu verwenden sein wird. Wie zuvor sind verschiedene Kodier-Schemata, gekennzeichnet durch verschiedene Gruppen von Unter-Rahmen verfügbar. In dieser Ausführungsform ist der Auswähler 85 jedoch vor dem tatsächlichen Kodieren platziert. Das Eingabe-Seiten-Signal xside tritt in den Auswähler 85 und eine Signal-Analysier-Einheit 84 ein. Das Ergebnis der Analyse wird die Eingabe eines Schalters 86, in welchem nur eines der Kodier-Schemata 81 verwendet wird. Die Ausgabe aus diesem Kodier-Schema wird auch das Ausgabe-Signal pside aus der Seiten-Signal-Kodier-Einheit 30 sein.In 3c is another embodiment of a page signal encoder unit 30 illustrated in accordance with the present invention. Here, the decision of frame length is an infinite loop decision based on the statistics of the signal. In other words, the spectral properties of the page signal are used as a basis for deciding which coding scheme to use. As before, various coding schemes characterized by different groups of subframes are available. In this embodiment, the selector 85 however, placed before actual coding. The input side signal x side enters the selector 85 and a signal analyzing unit 84 one. The result of the analysis is the input of a switch 86 in which only one of the coding schemes 81 is used. The output from this coding scheme will also be the output signal p side of the page th signal coding unit 30 be.

Der Vorteil mit einer Endlos-Schleifen-Entscheidung ist, dass nur eine Kodierung tatsächlich auszuführen ist. Der Nachteil ist jedoch, dass die Analyse der Signal-Eigenschaften tatsächlich sehr kompliziert sein kann und es schwierig sein kann, mögliches Verhalten vorherzusagen, um fähig zu sein, in dem Schalter 86 eine geeignete Wahl zu treffen. Eine Menge an statistischer Analyse von Ton muss ausgeführt und in der Signal-Analyse-Einheit 84 eingeschlossen sein. Irgendeine kleine Veränderung in den Kodier-Schemata kann das statistische Verhalten auf den Kopf stellen.The advantage with an infinite loop decision is that only one coding is actually to be executed. The disadvantage, however, is that the analysis of the signal characteristics can actually be very complicated and it can be difficult to predict possible behavior to be able to be in the switch 86 to make a suitable choice. A lot of statistical analysis of sound needs to be done and in the signal analysis unit 84 be included. Any little change in the coding schemes can turn statistical behavior upside down.

Durch das Verwenden der Endlos-Schleifen-Auswahl (3b) können Kodier-Schemata ohne irgendeine sonstige Änderung in dem Rest der Einheit ausgetauscht werden. Andererseits, wenn viele Kodier-Schemata zu untersuchen sind, werden die Rechenleistungs-Anforderungen hoch sein.By using the infinite loop selection ( 3b ) coding schemes may be exchanged without any other change in the remainder of the unit. On the other hand, if many coding schemes are to be investigated, the computational power requirements will be high.

Der Nutzen bei solch einem Kodieren variabler Länge für das Seiten-Signal ist, dass zwischen einer feinen zeitlichen Auflösung und grober Frequenz-Auflösung auf der einen Seite und grober zeitlicher Auflösung und feiner Frequenz-Auflösung auf der anderen Seite gewählt werden kann. Die obigen Ausführungsformen werden das Stereo-Bild in der bestmöglichen Weise erhalten.Of the The benefit of such variable length coding for the page signal is that between a fine temporal resolution and coarse frequency resolution one side and gross temporal resolution and fine frequency resolution chosen the other side can be. The above embodiments will be the stereo picture in the best possible Received manner.

Es gibt auch einige Erfordernisse für das tatsächliche in den verschiedenen Kodier-Schemata verwendete Kodieren. Insbesondere, wenn die Endlos-Schleifen-Auswahl verwendet wird, müssen die Rechenleistungs-Ressourcen groß sein, um eine Anzahl von mehr oder weniger gleichzeitigem Kodieren auszuführen. Umso komplizierter der Kodier-Vorgang ist, umso mehr Rechen-Leistung wird benötigt. Außerdem ist eine geringe Bit-Rate bei der Übertragung auch zu bevorzugen.It There are also some requirements for the actual coding used in the various coding schemes. Especially, if the infinite loop selection is used, the Computing power resources be great to perform a number of more or less simultaneous coding. more the more complex the coding process, the more computational power is required. Furthermore a low bit rate is also preferable in the transmission.

Das in US 5,434,948 präsentierte Verfahren verwendet eine gefilterte Version des Mono(Haupt)-Signals, um dem Seiten- oder Differenz-Signal zu gleichen. Die Filter-Parameter werden optimiert und dürfen mit der Zeit variieren. Die Filter-Parameter werden dann übertragen, repräsentierend eine Kodierung des Seiten-Signals. In einer Ausführungsform wird auch ein Seiten-Residuum-Signal übertragen. In vielen Fällen würde ein solches Vorgehen möglich sein, um als das Seiten-Signal-Kodier-Verfahren innerhalb des Geltungsbereichs dieser Erfindung verwendet zu werden. Dieses Vorgehen hat jedoch einige Nachteile. Die Quantelung der Filter-Koeffizienten und irgendein Seiten-Residuum-Signal erfordern oft relativ hohe Bit-Raten für die Übertragung, da die Ordnung des Filters hoch sein muss, um eine genaue Schätzung des Seiten-Signals zu liefern. Die Schätzung des Filters kann selbst problematisch sein, speziell in Fällen von Übergangs-reicher Musik. Schätzungs-Fehler werden ein modifiziertes Seiten-Signal ergeben, welches manchmal größer in Magnitude ist als das unmodifizierte Signal. Dieses wird zu höheren Bit-Raten-Anforderungen führen. Darüber hinaus, wenn eine neue Gruppe von Filter-Koeffizienten nach jeweils N Abtastungen berechnet werden, müssen die Filter-Koeffizienten interpoliert werden, um einen glatten Übergang von einer Gruppe von Filter-Koeffizienten zu einer anderen, wie oben diskutiert, zu ergeben. Interpolation von Filter-Koeffizienten ist eine komplexe Aufgabe und Fehler in der Interpolation werden sich in großen Seiten-Fehler-Signalen manifestieren, führend zu höheren Bit-Raten, benötigt für den Differenz-Fehler-Signal-Kodierer.This in US 5,434,948 The presented method uses a filtered version of the mono (main) signal to equal the page or difference signal. The filter parameters are optimized and may vary over time. The filter parameters are then transmitted representing a coding of the page signal. In one embodiment, a page residual signal is also transmitted. In many cases, such an approach would be possible to be used as the page signal encoding method within the scope of this invention. However, this procedure has some disadvantages. The quantization of the filter coefficients and any side residual signal often require relatively high bit rates for transmission because the order of the filter must be high to provide an accurate estimate of the side signal. The estimation of the filter itself can be problematic, especially in cases of transient-rich music. Estimation errors will result in a modified side signal, which is sometimes greater in magnitude than the unmodified signal. This will lead to higher bit rate requirements. In addition, when calculating a new set of filter coefficients after every N samples, the filter coefficients must be interpolated to give a smooth transition from one set of filter coefficients to another, as discussed above. Interpolation of filter coefficients is a complex task and errors in the interpolation will manifest themselves in large side-error signals, leading to higher bit-rates needed for the difference-error-signal-coder.

Ein Mittel, um die Notwendigkeit für Interpolation zu vermeiden, ist die Filter-Koeffizienten auf einer Abtastung-für-Abtastung-Basis zu aktualisieren und auf rückwärtsadaptive/verwendbare Analyse zu vertrauen. Für diese Arbeit wird es erforderlich sein, dass die Bit-Rate des Residuum-Kodierers ziemlich hoch ist. Dieses ist daher keine gute Alternative für Stereo-Kodierung bei niedriger Bit-Rate.One Means to the need for To avoid interpolation, the filter coefficients are on one Sample-by-sample basis to update and to backward / adaptable Trust analysis. For This work will require that the bit rate of the residual encoder be pretty much is high. This is therefore not a good alternative for stereo coding at low bit rate.

Es existieren Fälle, z. B. recht üblich mit Musik, in welchen das Mono- und die Differenz-Signale nahezu unkorreliert sind. Die Filter-Schätzung wird dann sehr mühevoll mit dem zusätzlichen Risiko, die Dinge für den Differenz-Fehler-Signal-Kodierer nur schlechter zu machen.It there are cases z. B. quite common with music in which the mono and differential signals are almost are uncorrelated. The filter estimation then becomes very painstaking the additional Risk things for the difference error signal encoder just to make it worse.

Die Lösung entsprechend zu US 5,434,948 kann recht gut arbeiten in Fällen, in welchen die Filter-Koeffizienten sich sehr langsam über die Zeit verändern, z. B. bei Telefon-Konferenz-Systemen. Im Fall von Musik-Signalen arbeit dieser Ansatz nicht sehr gut, da die Filter sich sehr schnell ändern müssen, um dem Stereo-Bild zu folgen. Das bedeutet, dass Unter-Rahmen-Längen von sehr verschiedener Größe zu verwenden sind, was bedeutet, dass die Anzahl von zu prüfenden Kombinationen rapide ansteigt. Das bedeutet wiederum, dass die Anforderungen für das Berechnen aller möglichen Kodier-Schemata unpraktikabel hoch werden.The solution according to US 5,434,948 can work quite well in cases where the filter coefficients change very slowly over time, e.g. B. in telephone conference systems. In the case of music signals, this approach does not work very well, since the filters have to change very fast to follow the stereo image. This means that subframe lengths of very different sizes are to be used, which means that the number of combinations to be tested increases rapidly. This in turn means that the requirements for computing all possible coding schemes become impractically high.

Daher basiert in einer bevorzugten Ausführungsform das Kodieren des Seiten-Signals auf der Idee, die Redundanz zwischen dem Mono- und dem Seiten-Signal durch Verwenden eines einfachen Abgleich/Ausgleich-Faktors anstelle eines komplexen Bit-Rate-verbrauchenden Prädiktor-Filters zu reduzieren. Das Residuum dieses Vorgangs wird dann kodiert. Die Größe eines solchen Residuums ist relativ klein und verlangt nicht nach hoher Bit-Rate für die Übertragung. Diese Idee ist tatsächlich sehr geeignet, um sie mit dem früher beschriebenen Ansatz der variablen Rahmen-Gruppe zu kombinieren, da die Berechnungs-Komplexität gering ist.Therefore, in a preferred embodiment, the coding of the side signal is based on the idea of reducing the redundancy between the mono and the side signal by using a simple balance / equalization factor instead of a complex bit rate consuming predictor filter. The Resi duum of this process is then coded. The size of such residual is relatively small and does not require high bit rate for transmission. In fact, this idea is very well suited to combine with the variable frame group approach described earlier, since the computational complexity is low.

Die Verwendung eines Abgleich/Ausgleich-Faktors, kombiniert mit dem Ansatz der variablen Rahmen-Länge beseitigt die Notwendigkeit von komplexer Interpolation und die verbundenen Probleme, welche Interpolation verursachen kann. Darüber hinaus ergibt die Verwendung eines einfachen Abgleich/Ausgleich-Faktors anstelle eines komplexen Filters weniger Probleme mit der Schätzung, da mögliche Schätz-Fehler für den Abgleich/Ausgleich-Faktor weniger Einfluss haben. Die bevorzugte Lösung wird fähig sein beides, verschobene Signale und diffuse Ton-Felder, mit guter Qualität und mit begrenzten Bit-Raten-Anforderungen und Berechnungs-Ressourcen zu reproduzieren.The Using an adjustment / compensation factor combined with the Variable frame length approach eliminates the need for complex interpolation and the related problems, which may cause interpolation. Furthermore results in the use of a simple adjustment / compensation factor instead of a complex filter, there are fewer problems with the estimation because possible estimation errors for the Balance / compensation factor have less influence. The preferred solution will be able both, shifted signals and diffuse sound fields, with good quality and with limited bit rate requirements and computational resources too reproduce.

4 illustriert eine bevorzugte Ausführungsform eines Stereo-Kodierers entsprechend der vorliegenden Erfindung. Diese Ausführungsform ist sehr ähnlich zu der in 2a gezeigten, jedoch mit den Details der Seiten-Signal-Kodier-Einheit 30 dargestellt. Der Kodierer 14 dieser Ausführungsform hat keine Vor-Verarbeitungs-Einheit und die Eingabe-Signale werden direkt an die Additions- Und Subtraktions-Einheiten 34, 36 geliefert. Das Mono-Signal xmono wird mit einem bestimmten Abgleich/Ausgleich-Faktor gsm in einem Multiplikator 33 multipliziert. In einer Subtraktions-Einheit 35 wird das multiplizierte Mono-Signal von dem Seiten-Signal xside subtrahiert, das ist hauptsächlich die Differenz zwischen den zwei Kanälen, um ein Residuum-Signal zu erzeugen. Der Abgleich/Ausgleich-Faktor gsm wird bestimmt basierend auf dem Inhalt der Mono- und Seiten-Signale durch den Optimierer 37, um das Residuum-Signal entsprechend zu einem Qualitäts-Kriterium zu minimieren. Das Qualitäts-Kriterium ist bevorzugt ein Kriterium der kleinsten Quadrate. Das Seiten-Residuum-Signal wird in einem Seiten-Residuum-Kodierer 39 entsprechen zu irgendeiner Kodier-Prozedur kodiert. Bevorzugt ist der Seiten-Residuum-Kodierer 39 ein Niedrig-Bit-Raten-Transformation-Kodierer oder ein CELP (Codebook Excited Linear Prediction)-Kodierer. Die Kodier-Parameter pside, repräsentierend das Seiten-Signal enthalten dann die Kodier-Parameter pside residual, repräsentierend das Seiten-Residuum-Signal und den optimierten Abgleich/Ausgleich-Faktor 49. 4 illustrates a preferred embodiment of a stereo encoder according to the present invention. This embodiment is very similar to that in FIG 2a shown, however, with the details of the side signal coding unit 30 shown. The encoder 14 This embodiment has no preprocessing unit and the input signals are sent directly to the addition and subtraction units 34 . 36 delivered. The mono signal x mono becomes a multiplier with a certain equalize / equalize factor g sm 33 multiplied. In a subtraction unit 35 For example, the multiplied mono signal is subtracted from the side signal x side , which is mainly the difference between the two channels to produce a residual signal. The balance factor g sm is determined based on the content of the mono and side signals by the optimizer 37 to minimize the residual signal according to a quality criterion. The quality criterion is preferably a least squares criterion. The page residual signal is in a page residual encoder 39 correspond to any coding procedure coded. Preferred is the page residual encoder 39 a low-bit-rate-transform encoder or a codebook excited linear prediction (CELP) encoder. The coding parameters p side representing the page signal then contain the coding parameters p side residual , representing the side residual signal and the optimized tuning / equalizing factor 49 ,

In der Ausführungsform der 4 ist das Mono-Signal 42, verwendet für das Synthetisieren der Seiten-Signale, das Ziel-Signal xmono für den Mono-Kodierer 38. Wie oben erwähnt (in Verbindung mit 2a) kann das Lokale-Synthese-Signal des Mono-Kodierers 38 auch verwendet sein. In dem letzteren Fall kann die gesamte Kodierer-Verzögerung vergrößert sein und die Berechnungs-Komplexität für das Seiten-Signal kann anwachsen. Andererseits kann die Qualität besser sein, da es dann möglich ist, in dem Mono-Kodierer gemachte Kodier-Fehler zu reparieren.In the embodiment of the 4 is the mono signal 42 , for synthesizing the page signals, uses the x mono signal for the mono encoder 38 , As mentioned above (in conjunction with 2a ) can be the local synthesis signal of the mono-coder 38 also be used. In the latter case, the overall encoder delay may be increased and the computational complexity for the page signal may increase. On the other hand, the quality can be better, since it is then possible to repair coding errors made in the mono-coder.

In einer mehr mathematischen Weise kann das grundlegende Kodier-Schema wie folgt beschrieben werden. Bezeichne die beiden Kanäle als a und b, welche der linke und der rechte Kanal eines Stereo-Paars sein können. Die Kanal-Signale werden durch Addition in ein Mono-Signal und durch Subtraktion in ein Seiten-Signal kombiniert. In Gleichungsform werden die Vorgänge beschrieben als: xmono(n) = 0.5(a(n) + b(n)) xside(n) = 0.5(a(n) – b(n)) In a more mathematical manner, the basic coding scheme can be described as follows. Designate the two channels as a and b, which can be the left and right channels of a stereo pair. The channel signals are combined by addition into a mono signal and by subtraction into a side signal. In equation form the operations are described as: x mono (n) = 0.5 (a (n) + b (n)) x side (n) = 0.5 (a (n) - b (n))

Es ist nützlich die xmono und xside -Signale um einen Faktor 2 nach unten zu skalieren. Es ist hier angenommen, dass andere Wege des Erzeugens der xmono und xside existieren. Man kann zum Beispiel verwenden: xmono(n) = γa(n) + (1 – γ)b(n) xside(n) = γa(n) – (1 – γ)b(n) 0 ≤ γ ≤ 1.0. It is useful to scale the x mono and x side signals down by a factor of 2. It is assumed here that other ways of generating x mono and x side exist. For example, you can use: x mono (n) = γa (n) + (1-γ) b (n) x side (n) = γa (n) - (1-γ) b (n) 0 ≤ γ ≤ 1.0.

Für Blöcke von Eingabe-Signalen wird ein modifiziertes Residuum-Seiten-Signal berechnet entsprechend zu: xside residual(n) = xside(n) – f(xmono' xside)xmono(n)wobei f(xmono, xside) eine Abgleich/Ausgleich-Faktor-Funktion ist, welche auf dem Block von N Abtastungen, das bedeutet einem Unter-Rahmen, des Seiten- und Mono-Signals basiert und welche bestrebt ist so viel wie möglich von dem Seiten-Signal zu entfernen. In anderen Worten, der Abgleich/Ausgleich-Faktor wird verwendet, um das Seiten-Residuum-Signal zu minimieren. In dem speziellen Fall, in welchem es im Sinne kleinster Fehler-Quadrate minimiert ist, ist dieses equivalent zum Minimieren der Energie des Seiten-Residuum-Signals xside residual.For blocks of input signals, a modified residual side signal is calculated according to: x side residual (n) = x side (n) - f (x mono' x side ) x mono (N) where f (x mono , x side ) is an equalize / equalize factor function which is on the block of N samples, the means a sub-frame based on the page and mono signal and which strives to remove as much of the page signal as possible. In other words, the balance / equalization factor is used to minimize the side residual signal. In the particular case where it is minimized in terms of least error squares, this is equivalent to minimizing the energy of the side residual signal x side residual .

In dem oben erwähnten speziellen Fall wird f(xmono, xside) beschrieben als:

Figure 00210001
wobei xside das Seiten-Signal und xmono das Mono-Signal ist. Bemerke, dass die Funktion basiert auf einem Block, beginnend bei „frame start" (Rahmen-Beginn) und endend bei „frame end" (Rahmen-Ende).In the special case mentioned above, f (x mono , x side ) is described as:
Figure 00210001
where x side is the side signal and x mono is the mono signal. Note that the function is based on a block, starting at "frame start" and ending at "frame end".

Es ist möglich in der Frequenz-Domäne bei der Berechnung des Abgleich/Ausgleich-Faktors Gewichtung hinzuzufügen. Dieses wird gemacht durch Konvolution der xside- und xmono-Signale mit der Impuls-Reaktion eines Gewichtungs-Filters. Es ist dann möglich, die Schätzungs-Fehler in einen Frequenzbereich zu schieben, in welchem diese weniger gut zu hören sind. Dieses wird als Wahrnehmungs-Wichtung bezeichnet.It is possible to add weighting in the frequency domain when calculating the adjustment / compensation factor. This is done by convolution of the x side and x mono signals with the impulse response of a weighting filter. It is then possible to shift the estimation errors to a frequency range where they are less easy to hear. This is called perceptual weighting.

Eine gequantelte Version des Abgleich/Ausgleich-Faktor-Werts, gegeben durch die Funktion f(xmono, xside) wird an den Dekodierer übertragen. Es ist vorzuziehen, die Quantelung bereits in Betracht zu ziehen, wenn das modifizierte Signal erzeugt wird. Der folgende Ausdruck wird dann erzielt: xside residual(n) = xside(n) – gQxmono(n)

Figure 00220001
A quantized version of the trim / offset factor value given by the function f (x mono , x side ) is transmitted to the decoder. It is preferable to already consider the quantization when the modified signal is generated. The following expression is then obtained: x side residual (n) = x side (n) - g Q x mono (N)
Figure 00220001

Qg(..) ist eine Quantelungs-Funktion, welche angewandt ist auf den Abgleich/Ausgleich-Faktor, gegeben durch die Funktion f(xmono, xside). Der Abgleich/Ausgleich-Faktor wird in dem Übertragungs-Kanal übertragen. In normalen links-rechts liegenden Signalen ist der Abgleich/Ausgleich-Faktor begrenzt auf das Intervall [–1.0 1.0]. Wenn andererseits die Signale außer Phase sind in Bezug zu einander, kann der Abgleich/Ausgleich-Faktor über diese Grenzen hinausgehen.Q g (..) is a quantization function which is applied to the balance / equalization factor given by the function f (x mono , x side ). The balance / equalization factor is transmitted in the transmission channel. In normal left-right signals, the adjustment / compensation factor is limited to the interval [-1.0 1.0]. On the other hand, if the signals are out of phase with each other, the balance / equalization factor may go beyond these limits.

Als ein optionales Mittel, um das Stereo-Bild zu stabilisieren, kann man den Abgleich/Ausgleich-Faktor begrenzen, wenn die normalisierte Quer-Korrelation zwischen dem Mono- und dem Seiten-Signal schlecht ist, wie gegeben durch die nachfolgende Gleichung:

Figure 00230001
wobeiAs an optional means to stabilize the stereo image, one can limit the balance / equalization factor if the normalized cross-correlation between the mono and the side signal is poor as given by the following equation:
Figure 00230001
in which

Figure 00230002
Figure 00230002

Diese Situationen treten recht häufig ein bei z. B. klassischer Musik oder Studio-Musik mit einem großen Anteil von diffusen Tönen, wobei die a und b Kanäle in manchen Fällen sich gegenseitig fast auslöschen in Fällen, in welchen ein Mono-Signal erzeugt wird. Die Wirkung auf den Abgleich/Ausgleich-Faktor ist, dass dieser schnell springen kann, verursachend ein verwischtes Stereo-Bild. Die obige Korrektur schwächt dieses Problem ab.These situations occur quite often at z. Classical music or studio music with a large proportion of diffused sounds, where the a and b channels in some cases almost cancel each other out in cases where a mono signal is generated. The effect on the balance / equalization factor is that this can jump quickly, creating a blurred stereo image. The above correction weakens this Problem.

Der Filter-basierte Ansatz in US 5,434,948 hat ähnliche Probleme, aber in jenem Fall ist die Lösung nicht so einfach.The filter-based approach in US 5,434,948 has similar problems, but in that case the solution is not so easy.

Wenn Es die Kodier-Funktion (z. B. ein Transformations-Kodierer) des Seiten-Residuum-Signals und Em die Kodier-Funktion des Mono-Signals ist, dann können die dekodierten a" und b"-Signale in dem Dekodierer-Ende beschrieben werden als (es ist angenommen hier, dass γ = 0.5): a''(n) = (1 + gQ)x''mono(n) + x''side(n) b''(n) = (1 – gQ)x''mono(n) – x''side(n) x''side = Es –1(Es(xside residual) x''mono = Em –1(Em(xmono)) If E s is the coding function (eg, a transform coder) of the side residual signal and E m is the coding function of the mono signal, then the decoded a "and b" signals in the decoder -End be described as (it is assumed here that γ = 0.5): a '' (n) = (1 + g Q ) X '' mono (n) + x '' side (N) b '' (n) = (1 - g Q ) X '' mono (n) - x '' side (N) x '' side = E s -1 (e s (x side residual ) x '' mono = E m -1 (e m (x mono ))

Ein wichtiger Nutzen aus dem Berechnen des Abgleich/Ausgleich-Faktors für jeden Rahmen ist, dass die Verwendung von Interpolation vermieden wird. Stattdessen wird normalerweise, wie oben beschrieben, die Rahmen-Verarbeitung mit überlappenden Rahmen ausgeführt.One important benefit from calculating the balance / compensation factor for each The framework is that the use of interpolation is avoided. Instead, normally, as described above, the frame processing is overlapping Frame executed.

Das Kodier-Prinzip verwendend Abgleich/Ausgleich-Faktoren arbeitet besonders gut in dem Fall von Musik-Signalen, wo typisch schnelle Wechsel benötigt werden, um dem Stereo-Bild zu folgen.The Using Coding Principle Matching / Compensation Factors works especially good in the case of music signals, where typically fast change needed to follow the stereo picture.

Kürzlich ist Viel-Kanal-Kodierung populär geworden. Ein Beispiel ist 5.1-Kanal Umgebungs-Ton in DVD-Filmen. Die Kanäle werden dann so angeordnet: vorne links, vorne Zentrum, vorne rechts, hinten links, hinten rechts und Sub-Woofer. In 5 ist eine Ausführungsform eines Kodierers dargestellt, welcher die drei Front-Kanäle in einer solchen Anordnung, ausnutzend Zwischen-Kanal-Redundanzen entsprechend der vorliegenden Erfindung, kodiert.Recently, multi-channel coding has become popular. An example is 5.1ch surround sound in DVD movies. The channels are then arranged like: front left, front center, front right, back left, back right and sub woofer. In 5 For example, an embodiment of an encoder is illustrated that encodes the three front channels in such an arrangement utilizing inter-channel redundancies according to the present invention.

Die drei Kanäle L, C, R werden an die drei Eingängen 16A-C geliefert und das Mono-Signal xmono wird als Summe aus allen drei Kanälen erzeugt. Eine Zentrum-Signal-Kodierer-Einheit 130 ist hinzugefügt, welche das Zentrums-Signal xcentre empfängt. Das Mono-Signal 42 ist in dieser Ausführungsform das kodierte und dekodierte Mono-Signal x''mono und ist multipliziert mit einem bestimmten Abgleich/Ausgleich-Faktor gQ in einem Multiplizierer 133. In einer Subtrahier-Einheit 135 wird das multiplizierte Mono-Signal von dem Zentrum-Signal Xcentre subtrahiert, um ein Zentrum-Residuum-Signal zu erzeugen. Der Abgleich/Ausgleich-Faktor gQ wird bestimmt basierend auf dem Inhalt des Mono- und des Zentrum-Signals durch einen Optimierer 137, um das Zentrum-Residuum-Signal entsprechend zu einem Qualitäts-Kriterium zu minimieren. Das Zentrum-Signal wird in einem Zentrum-Residuum-Kodierer 139 entsprechend zu irgendeiner Kodier-Prozedur kodiert. Bevorzugt ist der Zentrum-Residuum-Kodierer 139 ein niedrig-Bit-Raten Transformations-Kodierer oder ein CELP-Kodierer. Die Kodier-Parameter pcentre, repräsentierend das Zentrum-Signal, umfassen dann die Kodier-Parameter pcentre residual, repräsentierend das Zentrum-Residuuum-Signal und den optimierten Abgleich/Ausgleich-Faktor 149. Das Zentrum-Residuum-Signal und das skalierte Mono-Signal werden in einer Addier-Einheit 235 addiert, erzeugend ein modifiziertes Zentrum-Signal 142, welches für Kodier-Fehler kompensiert ist.The three channels L, C, R are connected to the three inputs 16A -C and the mono signal x mono is generated as the sum of all three channels. A center signal encoder unit 130 is added, which receives the center signal x center . The mono signal 42 In this embodiment, the coded and decoded mono signal x "is mono and is multiplied by a certain equalize / equalize factor g Q in a multiplier 133 , In a subtracting unit 135 The multiplied mono signal is subtracted from the center signal X center to produce a center residual signal. The balance / compensation factor g Q is determined based on the contents of the mono and center signals by an optimizer 137 to minimize the center residual signal according to a quality criterion. The center signal is in a center-to-field encoder 139 encoded according to any coding procedure. Preferred is the center-to-center encoder 139 a low bit rate transform encoder or a CELP encoder. The coding parameters p center , representing the center signal, then comprise the coding parameters p center residual , representing the center residual signal and the optimized tuning / equalizing factor 149 , The center residual signal and the scaled mono signal are stored in an adder unit 235 adds generating a modified center signal 142 , which is compensated for coding errors.

Das Seiten-Signal xside, das ist die Differenz zwischen links L und rechts R-Kanälen wird an die Seiten-Signal-Kodierer-Einheit 30 wie in zuvor behandelten Ausführungsformen geliefert. Jedoch hängt hier der Optimierer 37 auch von dem modifizierten Zentrum-Signal 142, geliefert durch die Zentrum-Signal-Kodierer-Einheit 130, ab. Das Seiten-Residuum-Signal wird daher als eine optimale Linearkombination des Mono-Signals 42, des modifizierten Zentrum-Signals 142 und des Seiten-Signals in der Subtraktions-Einheit 35 erzeugt.The side signal x side , that is the difference between left L and right R channels, is sent to the side signal coder unit 30 as supplied in previously discussed embodiments. However, here's the optimizer 37 also from the modified center signal 142 supplied by the center signal encoder unit 130 , from. The side residual signal is therefore considered to be an optimal linear combination of the mono signal 42 , the modified center signal 142 and the side signal in the subtraction unit 35 generated.

Das oben beschriebene Konzept variabler Rahmen-Längen kann auf jedem der Seiten- und Zentrum-Signale oder auf beide angewandt werden.The The concept of variable frame lengths described above can be used on any of the and center signals or both.

6 illustriert eine Dekodier-Einheit, brauchbar für das Empfangen kodierter Audio-Signale aus einer Kodier-Einheit der 5. Das empfangene Signal 54 ist unterteilt in Kodier-Parameter pmono, repräsentierend das Haupt-Signal, Kodier-Parameter pcentre, repräsentierend das Zentrum-Signal und Kodier-Parameter pside, repräsentierend das Seiten-Signal. In dem Dekodierer 64 werden die Kodier-Parameter pmono, repräsentierend das Haupt-Signal, verwendet, um ein Haupt-Signal x''mono zu erzeugen. In dem Dekodierer 160 werden die Kodier-Parameter pcentre, repräsentierend das Zentrum-Signal, verwendet, um ein Zentrum-Signal x''centre zu erzeugen, basierend auf dem Haupt-Signal x''mono. In dem Dekodierer 60 werden die Kodier-Parameter pside, repräsentierend das Seiten-Signal, dekodiert, erzeugend ein Seiten-Signal x''side, basierend auf dem Haupt-Signal x''mono und dem Zentrum-Signal x''centre. Die Prozedur kann mathematisch wie folgt ausgedrückt werden:
Die Eingabe-Signale xleft, xright und xcentre werden in einen Mono-Kanal kombiniert entsprechend zu: xmono(n) = αcxleft(n) + βxright(n) + χxcentre(n),α, β und χ sind zwecks Einfachheit in dem verbleibenden Abschnitt auf 1.0 gesetzt, aber sie können auf beliebige Werte gesetzt werden. Die α, β und χ-Werte können entweder konstant sein oder abhängig von den Signal-Inhalten, um den einen oder anderen Kanal hervorzuheben um optimale Qualität zu erzielen.
6 illustrates a decoding unit useful for receiving coded audio signals from a coding unit of the present invention 5 , The received signal 54 is divided into encode parameter p mono representing the main signal, encode parameter p center representing the center signal and encode parameter p side representing the page signal. In the decoder 64 For example, the coding parameters p mono representing the main signal are used to mono generate a main signal x ". In the decoder 160 become the Ko the parameter p center representing the center signal used to generate a center signal x " center based on the main signal x" mono . In the decoder 60 the coding parameters p side representing the page signal are decoded generating a page signal x " side , based on the main signal x" mono and the center signal x " center . The procedure can be expressed mathematically as follows:
The input signals x left , x right and x center are combined into a mono channel corresponding to: x mono (n) = αcx left (n) + βx right (n) + χx center (N) α, β and χ are set to 1.0 in the remaining section for simplicity, but they can be set to any values. The α, β and χ values can either be constant or dependent on the signal content to highlight one or the other channel for optimum quality.

Die normalisierte Quer-Korrelation zwischen dem Mono- und dem Zentrum-Signal wird berechnet als:

Figure 00260001
wobeiThe normalized cross-correlation between the mono and center signals is calculated as:
Figure 00260001
in which

Figure 00260002
Figure 00260002

xcentre das Zentrum-Signal und xmono das Mono-Signal ist. Das Mono-Signal kommt aus dem Mono-Ziel-Signal, aber es ist möglich ebenso gut die lokale Synthese des Mono-Kodierers zu verwenden.x center is the center signal and x mono is the mono signal. The mono signal comes from the mono-target signal, but it is equally possible to use the local synthesis of the mono-coder.

Das zu kodierende Zentrum-Residuum-Signal ist: xcentre residual(n) = xcentre(n) – gQxmono(n)

Figure 00260003
Qg(..) ist eine Quantelung-Funktion, welche auf den Abgleich/Ausgleich-Faktor angewandt ist. Der Abgleich/Ausgleich-Faktor wird über den Übertragungs-Kanal übertragen.The center residual signal to be encoded is: x center residual (n) = x center (n) - g Q x mono (N)
Figure 00260003
Q g (..) is a quantization function applied to the balance / equalization factor. The adjustment / compensation factor is transmitted via the transmission channel.

Wenn Ec die Kodier-Funktion (z. B. ein Transformations-Kodierer) des Zentrum-Residuum-Signals und Em die Kodier-Funktion des Mono-Signals ist, dann kann das dekodierte xcentre-Signal an dem Ende des Dekodierers beschrieben werden als: x''centre(n) = gQx''mono(n) + x''centre residual(n) x''centre residual = Ec –1(Ec(xcentre residual)) x''mono = Em –1(Em(xmono)). If E c is the coding function (eg, a transform coder) of the center residual signal and E m is the coding function of the mono signal, then the decoded x center signal at the end of the decoder may be described are as: x '' center (n) = g Q x '' mono (n) + x '' center residual (N) x '' center residual = E c -1 (e c (x center residual )) x '' mono = E m -1 (e m (x mono )).

Das zu kodierende Seiten-Residuum-Signal ist: xside residual(n) = (xleft(n) – xright(n)) – gQsmx''mono(n) – gQscx''centre(n)wobei gQsm und gQsc gequantelte Werte der Parameter gsm und gsc sind, welche diesen Ausdruck minimieren:

Figure 00270001
η kann zum Beispiel gleich 2 sein für eine Fehler-Minimierung der kleinsten Fehler-Quadrate. Die gsm und gsc-Parameter können gemeinsam oder getrennt gequantelt sein.The page residual signal to be encoded is: x side residual (n) = (x left (n) - x right (n)) - g Qsm x '' mono (n) - g qsc x '' center (N) where g Qsm and g Qsc are quantized values of the parameters g sm and g sc which minimize this expression:
Figure 00270001
For example, η may equal 2 for an error minimization of the smallest error squares. The g sm and g sc parameters can be shared or separated.

Wenn Es die Kodier-Funktion des Seiten-Residuum-Signals ist, dann sind die dekodierten x''left und x''right-Kanal-Signale gegeben als: x''left(n) = x''mono(n) – x''centre(n) + x''side(n) x''right(n) = x''mono(n) – x''centre(n) + x''side(n) x''side(n) = x''side residual + gQsmx''mono(n) + gQscx''centre(n) x''side residual = Es –1(Es(xside residual)). If E s is the encoding function of the side residual signal, then the decoded x '' left and x '' right channel signals are given as: x '' left (n) = x '' mono (n) - x '' center (n) + x '' side (N) x '' right (n) = x '' mono (n) - x '' center (n) + x '' side (N) x '' side (n) = x '' side residual + g Qsm x '' mono (n) + g qsc x '' center (N) x '' side residual = E s -1 (e s (x side residual )).

Einer der Wahrnehmungs-Artefakte, welche am meisten störend sind, ist der Vor-Echo-Effekt. In den 7a-b illustrieren Diagramme einen solchen Artefakt. Nehme eine Signal-Komponente an, aufweisend die zeitliche Entwicklung wie durch die Kurve 100 dargestellt. Am Anfang, beginnend bei t0, ist die Signal-Komponente in der Audio-Abtastung nicht vorhanden. Zu einer Zeit t zwischen t1 und t2 erscheint die Signal-Komponente plötzlich. Wenn die Signal-Komponente kodiert wird, verwendend eine Rahmenlänge von t2–t1, wird das Auftreten der Signal-Komponente „verschmiert" sein über den gesamten Rahmen, wie in Kurve 101 angezeigt. Wenn eine Dekodierung der Kurve 101 stattfindet, erscheint die Signal-Komponente zu einer Zeit Δt vor dem beabsichtigten Erscheinen der Signal-Komponente und ein „Vor-Echo" wird wahrgenommen.One of the most disturbing perceptual artifacts is the pre-echo effect. In the 7a -b diagrams illustrate such an artifact. Suppose a signal component having the temporal evolution as through the curve 100 shown. At the beginning, starting with t0, the signal component is not present in the audio sample. At a time t between t1 and t2, the signal component suddenly appears. If the signal component is coded using a frame length of t2-t1, the occurrence of the signal component will be "smeared" over the entire frame, as in curve 101 displayed. If a decoding of the curve 101 takes place, the signal component appears at a time Δt before the intended appearance of the signal component, and a "pre-echo" is detected.

Die Vor-Echo-Artefakte werden deutlicher, wenn lange Kodier-Rahmen verwendet werden. Durch Verwendung kürzerer Rahmen wird der Artefakt etwas unterdrückt. Ein anderer Weg, um oben beschriebene Vor-Echo-Probleme zu behandeln, ist die Tatsache zu nutzen, dass das Mono-Signal verfügbar ist an beiden, dem Kodierer- und dem Dekodierer-Ende. Dieses macht es möglich, das Seiten-Signal zu skalieren, entsprechend der Energie-Kontur des Mono-Signals. An dem Dekodierer-Ende wird das inverse Skalieren ausgeführt und so können einige der Vor-Echo-Probleme erleichtert werden.The Pre-echo artifacts become more apparent when using long encoding frames become. By using shorter ones Frame, the artifact is somewhat suppressed. Another way to go up to treat pre-echo problems described is the fact too that the mono signal is available on both the encoder and and the decoder end. This makes it possible to adjust the page signal scale, according to the energy contour of the mono signal. At the decoder end inverse scaling is done and so can some the pre-echo problems be relieved.

Eine Energie-Kontur des Mono-Signals wird über den gesamten Rahmen berechnet als:

Figure 00280001
wobei w(n) eine Fenster-Funktion ist. Die einfachste Fenster-Funktion ist eine Rechtecks-Funktion, es können aber andere Fenster-Typen, solche wie ein Hamming-Fenster, bevorzugter sein.An energy contour of the mono signal is calculated over the entire frame as:
Figure 00280001
where w (n) is a window function. The simplest window function is a rectangle function, but other types of windows, such as a Hamming window, may be more preferable.

Das Seiten-Residuum-Signal ist dann skaliert als:

Figure 00290001
The page residual signal is then scaled as:
Figure 00290001

In einer allgemeineren Form kann die obige Gleichung geschrieben werden als:

Figure 00290002
wobei f(..) eine monotone kontinuierliche Funktion ist. In dem Dekodierer wird die Energie-Kontur für das dekodierte Mono-Signal berechnet und auf das dekodierte Signal angewandt als: x''side(n) = x''side(n)f(Ec(n)), frame start ≤ n ≤ frame end. In a more general form, the above equation can be written as:
Figure 00290002
where f (..) is a monotonic continuous function. In the decoder, the energy contour for the decoded mono signal is calculated and applied to the decoded signal as: x '' side (n) = x '' side (N) f (E c (n)), frame start ≤ n ≤ frame end.

Da dieses Energie-Kontur-Skalieren in mancher Weise alternativ zu der Verwendung der kürzeren Rahmen-Längen ist, ist dieses Konzept besonders gut geeignet, um kombiniert zu werden mit dem weiter oben beschriebenen Konzept der variablen Rahmen-Längen. Dadurch, dass einige Kodier-Schemata, welche Energie-Kontur-Skalieren anwenden, einige, welche dies nicht tun, und einige, welche Energie-Kontur-Skalieren nur während bestimmter Unter-Rahmen anwenden, verfügbar sind, kann eine flexiblere Gruppe von Kodier-Schemata bereitgestellt werden. In 8 ist eine Ausführungsform einer Signal-Kodierer-Einheit 30 entsprechend der vorliegenden Erfindung illustriert. Hier umfassen die verschiedenen Kodier-Schemata 81 gestrichelte Unter-Rahmen 91, repräsentierend Kodierung anwendend Kontur-Skalieren, und nicht gestrichelte Unter-Rahmen 92, repräsentierend Kodier-Prozeduren Kontur-Skalieren nicht anwendend. Auf diese Weise sind Kombinationen nicht nur von Unter-Rahmen verschiedener Länge, sondern auch von Unter-Rahmen mit verschiedenen Kodier-Prinzipien verfügbar. In dem vorliegenden erläuternden Beispiel unterscheidet sich die Anwendung von Energie-Kontur-Skalierung für verschiedene Kodier-Schemata. In einem allgemeineren Fall können irgendwelche Kodier-Prinzipien in analoger Weise mit dem Konzept der variablen Längen kombiniert werden.Since this energy contour scaling is in some ways alternative to the use of the shorter frame lengths, this concept is particularly well suited to be combined with the concept of variable frame lengths described above. By having some coding schemes that apply energy contour scaling, some that do not, and some that apply energy contour scaling only during certain sub-frames available, a more flexible set of coding may be available. Schemas are provided. In 8th is an embodiment of a signal encoder unit 30 illustrated in accordance with the present invention. Here are the different coding schemes 81 dashed sub-frame 91 representing coding applying contour scaling, and not dashed Un ter-frame 92 , representing coding procedures not applying contour scaling. In this way, combinations are available not only from subframes of different lengths, but also from subframes with different coding principles. In the present illustrative example, the application of energy contour scaling differs for different coding schemes. In a more general case, any coding principles may be analogously combined with the concept of variable lengths.

Die Gruppe von Kodier-Schemata der 8 umfasst Schemata, welche z. B. Vor-Echo-Artefakte auf verschiedene Weise handhaben. In einigen Schemata werden längere Unter-Rahmen mit Vor-Echo-Minimierung entsprechend dem Energie-Kontur-Prinzip verwendet. In anderen Schemata werden kürzere Unter-Rahmen ohne Energie-Kontur-Skalierung verwendet. Abhängig von dem Signal-Inhalt kann eine der Alternativen vorteilhafter sein. Für Fälle sehr massiven Vor-Echos können Kodier-Schemata, verwendend kurze Unter-Rahmen mit Energie-Kontur-Skalierung erforderlich sein.The group of coding schemes of 8th includes schemes which z. B. handle pre-echo artifacts in various ways. In some schemes, longer sub-frames are used with pre-echo minimization according to the energy contour principle. Other schemes use shorter subframes without energy contour scaling. Depending on the signal content, one of the alternatives may be more advantageous. For cases of very massive pre-echoes, coding schemes using short sub-frames with energy contour scaling may be needed.

Die vorgeschlagene Lösung kann in dem gesamten Frequenzband oder in einem oder mehreren bestimmten Sub-Bändern verwendet werden. Die Verwendung von Sub-Bändern kann angewandt werden entweder auf beide, Haupt- und Seiten-Signale oder getrennt auf eines von diesen. Eine bevorzugte Ausführungsform umfasst eine Aufspaltung des Seiten-Signals in einige Frequenz-Bänder. der Grund ist einfach, dass es leichter ist, die mögliche Redundanz in einem isolierten Frequenz-Band zu entfernen als in dem gesamten Frequenz-Band. Dieses ist insbesondere wichtig, wenn Musik-Signale mit reichem spektralem Inhalt kodiert werden.The suggested solution may be in the entire frequency band or in one or more specific ones Sub-bands be used. The use of sub-bands can be used either on both main and side signals or separately on one of these. A preferred embodiment comprises a splitting of the side signal in some frequency bands. the reason is simple, that it is easier, the possible redundancy to remove in an isolated frequency band than in the whole Frequency band. This is especially important if music signals be encoded with rich spectral content.

Eine mögliche Anwendung ist, das Frequenz-Band unterhalb eines vorbestimmten Schwellwerts mit dem obigen Verfahren zu kodieren. der vorbestimmte Schwellwert kann bevorzugt bei 2 kHz oder noch besser bei 1 kHz liegen. Für den verbleibenden Teil des Frequenz-Bereichs von Interesse kann ein anderes zusätzliches Frequenz-Band mit dem obigen Verfahren kodiert werden oder es kann ein völlig anderes Verfahren verwendet werden.A possible Application is, the frequency band below a predetermined threshold encode with the above method. the predetermined threshold may preferably be at 2 kHz or even better at 1 kHz. For the remaining Part of the frequency range of interest may be another additional one Frequency band can be encoded with the above method or it can a completely other method can be used.

Es ist eine Motivation für das Verwenden des obigen Verfahrens bevorzugt für niedrige Frequenzen, dass die diffusen Ton-Felder generell wenig Energie-Inhalt bei hohen Frequenzen haben. Der natürliche Grund ist, dass Ton-Absorption typisch mit der Frequenz anwächst. Auch scheinen die diffusen Ton-Feld-Komponenten bei hohen Frequenzen eine weniger wichtige Rolle für das menschliche Gehör-System zu spielen. Daher ist es nützlich, diese Lösung bei niedrigen Frequenzen (unter 1 oder 2 kHz) einzusetzen und bei höheren Frequenzen auf andere, sogar effizientere Kodier-Schemata zu vertrauen. Die Tatsache, dass das Schema nur bei niedrigen Frequenzen angewandt wird, ergibt eine große Einsparung an Bit-Rate, da die notwendige Bit-Rate bei dem vorgeschlagenen Verfahren proportional ist zu der erforderlichen Bandbreite. In den meisten Fällen kann der Mono-Kodierer das gesamte Frequenz-Band kodieren, während das vorgeschlagene Kodieren des Seiten-Signals vorgeschlagen ist, nur in dem unteren Teil des Frequenz-Bands ausgeführt zu werden, wie durch 9 illustriert. Die Bezugsnummer 301 bezieht sich auf ein Kodier-Schema für das Seiten-Signal entsprechend der vorliegenden Erfindung. Bezugsnummer 302 bezieht sich auf irgendein anderes Kodier-Schema des Seiten-Signals und Bezugsnummer 303 bezieht sich auf ein Kodier-Schema des Seiten-Signals.It is a motivation for using the above method, preferred for low frequencies, that the diffuse tone fields generally have little energy content at high frequencies. The natural reason is that sound absorption typically increases with frequency. Also, the diffuse sound-field components at high frequencies seem to play a less important role in the human auditory system. Therefore, it is useful to use this solution at low frequencies (below 1 or 2 kHz) and rely on other, even more efficient coding schemes at higher frequencies. The fact that the scheme is applied only at low frequencies gives a great bit rate saving since the required bit rate in the proposed method is proportional to the required bandwidth. In most cases, the mono-coder can encode the entire frequency band, while the proposed coding of the page signal is suggested to be performed only in the lower part of the frequency band, as by 9 illustrated. The reference number 301 refers to a coding scheme for the page signal according to the present invention. reference number 302 refers to any other coding scheme of the page signal and reference number 303 refers to a coding scheme of the page signal.

Es besteht auch die Möglichkeit, das vorgeschlagene Verfahren für einige bestimmte Frequenz-Bänder zu verwenden.It there is also the possibility the proposed procedure for some specific frequency bands to use.

In 10 sind die Haupt-Schritte einer Ausführungsform eines Kodier-Verfahrens entsprechend der vorliegenden Erfindung als Fluss-Diagramm illustriert. Die Prozedur beginnt im Schritt 200. Im Schritt 210 wird ein von den polyphonen Signalen abgeleitetes Haupt-Signal kodiert. Im Schritt 212 werden Kodier-Schemata bereitgestellt, welche Unter-Rahmen mit verschiedenen Längen und/oder Reihenfolge umfassen. Ein im Schritt 214 aus den polyphonen Seiten-Signalen abgeleitetes Seiten-Signal wird kodiert durch ein Kodier-Schema, ausgewählt abhängig zumindest teilweise von dem tatsächlichen Signal-Inhalt der polyphonen Signale. Die Prozedur endet im Schritt 299.In 10 The main steps of one embodiment of a coding method according to the present invention are illustrated as a flow chart. The procedure begins in step 200 , In step 210 a main signal derived from the polyphonic signals is coded. In step 212 Coding schemes are provided which include sub-frames of different lengths and / or order. One in the step 214 Side signal derived from the polyphonic side signals is encoded by a coding scheme selected at least in part depending on the actual signal content of the polyphone signals. The procedure ends in step 299 ,

In 11 sind die Haupt-Schritte einer Ausführungsform eines Dekodier-Verfahrens entsprechend der vorliegenden Erfindung als ein Fluss-Diagramm illustriert. Die Prozedur beginnt im Schritt 200. Im Schritt 220 wird ein empfangenes kodiertes Haupt-Signal dekodiert. Im Schritt 222 werden Kodier-Schemata bereitgestellt, welche Unter-Rahmen mit unterschiedlichen Längen und/oder Reihenfolge umfassen. Ein empfangenes Seiten-Signal wird im Schritt 224 dekodiert durch ein ausgewähltes Kodier-Schema. Im Schritt 226 werden die dekodierten Haupt- und Seiten-Signale zu einem polyphonen Signal kombiniert. Die Prozedur endet im Schritt 299.In 11 For example, the main steps of one embodiment of a decoding method according to the present invention are illustrated as a flow chart. The procedure begins in step 200 , In step 220 a received coded main signal is decoded. In step 222 Coding schemes are provided which include sub-frames of different lengths and / or order. A received page signal is in step 224 decoded by a selected coding scheme. In step 226 The decoded main and side signals are combined into a polyphonic signal. The procedure ends in step 299 ,

Die oben beschriebenen Ausführungsformen sind zu verstehen als einige wenige illustrative Beispiele der vorliegenden Erfindung. Es wird durch mit dem Gebiet Vertrauten verstanden werden, dass verschiedene Modifikationen, Kombinationen und Veränderungen an den Ausführungsformen gemacht werden können, ohne von dem Geltungsbereich der vorliegenden Erfindung abzuweichen. Insbesondere können verschiedene Teil-Lösungen in den verschiedenen Ausführungsformen in anderen Konfigurationen kombiniert werde, wo technisch möglich. Der Geltungsbereich der vorliegenden Erfindung ist jedoch definiert durch die angehängten Ansprüche.The Embodiments described above are to be understood as a few illustrative examples of the present Invention. It will be understood by those familiar with the field, that different modifications, combinations and changes on the embodiments can be done without to deviate from the scope of the present invention. In particular, you can different part solutions in the various embodiments combined in other configurations where technically possible. Of the Scope of the present invention is defined, however by the appended claims.

REFERENZENREFERENCES

  • European Patent 0497413European Patent 0497413
  • US patent 5,285,498US patent 5,285,498
  • US patent 5,434,948US patent 5,434,948
  • „Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, May 2002, Munich, Germany by C. Faller et al."Binaural cue coding to stereo and multi-channel audio compression ", 112th AES convention, May 2002, Munich, Germany by C. Faller et al.

Claims (26)

Ein Verfahren des Kodierens von Vielkanal-Audio-Signalen, umfassend die Schritte des: Erzeugens (210) eines ersten Ausgabe-Signals (pmono), welches ein Haupt-Signal (xmono) repräsentierende Kodier-Parameter sind, wobei das Haupt-Signal (xmono) eine erste Linear-Kombination von Signalen von zumindest einem ersten und einem zweiten Kanal (a, b; L, R) ist; und Erzeugens (214) eines zweiten Ausgabe-Signals (pside), welches ein Seiten-Signal (xside) repräsentierende Kodier-Parameter sind, wobei das Seiten-Signal (xside) eine zweite Linear-Kombination von Signalen von zumindest einem ersten Kanal und einem zweiten Kanal (a, b; L, R) innerhalb eines Kodier-Rahmens (80) ist, gekennzeichnet durch den weiteren Schritt des: Bereitstellens (212) von zumindest zwei Kodier-Schemata (81), wobei jedes der zumindest zwei Kodier-Schemata charakterisiert ist durch eine zugehörige Gruppe von Unter-Rahmen (90), wobei jede Gruppe von Unter-Rahmen den Kodier-Rahmen (80) bildet, wobei die Unter-Rahmen (90) der Unter-Rahmen-Gruppen unterschiedliche Längen aufweisen; die Summe der Längen der Unter-Rahmen (90) in jedem Kodier-Schema (81) gleich ist zur Länge des Kodier-Rahmens (80); jede Gruppe von Unter-Rahmen (90) zumindest einen Unter-Rahmen (90) umfasst; wobei der Schritt des Erzeugens (214) des zweiten Ausgabe-Signals (pside) den Schritt des Wählens eines Kodier-Schemas (81), zumindest zu einem Teil abhängig von einem vorliegenden Signal-Inhalt des Seiten-Signals (xside), umfasst; das zweite Ausgabe-Signal (pside) in jedem der Unter-Rahmen (90) der gewählten Gruppe von Unter-Rahmen (90) getrennt kodiert ist.A method of encoding multi-channel audio signals comprising the steps of: generating ( 210 ) of a first output signal (p mono ), which are coding parameters representing a main signal (x mono ), the main signal (x mono ) being a first linear combination of signals from at least a first and a second channel (a, b; L, R); and generating ( 214 ) Of a second output signal (p side), which are a side signal (x side) representing encoding parameters, wherein the side signal (x side) being a second linear combination of signals of at least a first channel and a second Channel (a, b; L, R) within a coding frame ( 80 ), characterized by the further step of: providing ( 212 ) of at least two coding schemes ( 81 ), wherein each of the at least two coding schemes is characterized by an associated group of sub-frames ( 90 ), where each group of subframes encodes the coding frame ( 80 ), the sub-frames ( 90 ) of the subframe groups have different lengths; the sum of the lengths of subframes ( 90 ) in each coding scheme ( 81 ) is equal to the length of the coding frame ( 80 ); each group of subframes ( 90 ) at least one subframe ( 90 ); wherein the step of generating ( 214 ) of the second output signal (p side ), the step of selecting a coding scheme ( 81 ), at least in part dependent on a present signal content of the page signal (x side ); the second output signal (p side ) in each of the subframes ( 90 ) of the selected group of subframes ( 90 ) is coded separately. Ein Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Schritt des Erzeugens (214) des zweiten Ausgabe-Signals (pside) wiederum diese Schritte umfasst: Erzeugen von Kodier-Parametern, das Seiten-Signal (xside) getrennt repräsentierend innerhalb aller Unter-Rahmen (90) eines jeden der zumindest zwei Gruppen von Unter-Rahmen (90); Berechnen eines Wiedergabetreue-Maßes für jedes der zumindest zwei Kodier-Schemata (81); und Wählen des kodierten Signals aus dem Kodier-Schema (81), aufweisend das beste Wiedergabetreue-Maß, als die das Seiten-Signal repräsentierenden Kodier-Parameter (pside).A method according to claim 1, characterized in that the step of generating ( 214 ) of the second output signal (p side ), in turn, comprises the steps of: generating coding parameters representing the side signal (x side ) separately within all subframes ( 90 ) of each of the at least two groups of subframes ( 90 ); Calculating a fidelity measure for each of the at least two coding schemes ( 81 ); and selecting the coded signal from the coding scheme ( 81 ) having the best fidelity measure, as the side parameter representing coding parameter (p side ). Ein Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass das Wiedergabetreue-Mail auf einem Signal-zu-Rauschen-Maß basiert.A method according to claim 2, characterized that the fidelity mail is based on a signal-to-noise measure. Ein Verfahren nach irgendeinem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Unter-Rahmen (90) Längen lsf aufweisen, entsprechend zu
Figure 00350001
wobei lf die Länge des Kodier-Rahmens (80) ist und n ein Integer ist.
A method according to any one of claims 1 to 3, characterized in that the sub-frames ( 90 ) Have lengths l sf , corresponding to
Figure 00350001
where l f is the length of the coding frame ( 80 ) and n is an integer.
Ein verfahren nach Anspruch 4, dadurch gekennzeichnet, dass n kleiner ist als ein vorgegebener Wert.A method according to claim 4, characterized that n is less than a predetermined value. Ein Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass zumindest zwei Kodier-Schemata (81) alle Permutationen von Unter-Rahmen-Längen umfassen.A method according to claim 5, characterized in that at least two coding schemes ( 81 ) comprise all permutations of subframe lengths. Ein Verfahren nach irgendeinem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass die Schritte des Erzeugens (210) des ersten Ausgabe-Signals (pmono) wiederum umfassen die Schritte des: Erzeugens des Haupt-Signals (xmono); und Kodierens des Haupt-Signals (xmono) in das Haupt-Signal repräsentierende Kodier-Parameter (pmono); wobei die Schritte des Erzeugens (214) des zweiten Ausgabe-Signals wiederum diese Schritte umfassen: Erzeugen eines Seiten-Residuum-Signal (xside residual) als einer Differenz zwischen dem Seiten-Signal (xside) und dem Haupt-Signal (xmono), skaliert durch einen Abgleich/Ausgleich-Faktor (gsm), wobei der Abgleich/Ausgleich-Faktor (gsm) festgelegt ist als ein das Seiten-Residuum-Signal in Übereinstimmung mit einem Qualitäts-Kriterium minimierender Faktor; und Kodieren des Seiten-Residuum-Signals und des Abgleich/Ausgleich-Faktors (gsm) in die das Seiten-Signal repräsentierenden Kodier-Parameter (pside).A method according to any one of claims 1 to 6, characterized in that the steps of generating ( 210 ) of the first output signal (p mono ), in turn, comprise the steps of: generating the main signal (x mono ); and coding the main signal (x mono ) into the main signal representing coding parameters (p mono ); the steps of creating ( 214 ) Of the second output signal in turn comprising the steps of: creating a side residual signal (x side residual) as a difference between the side signal (x side) and the main signal (x mono) scaled by a balance / Balancing factor (g sm ), wherein the balancing / balancing factor (g sm ) is set as a factor minimizing the side residual signal in accordance with a quality criterion; and encoding the side residual signal and the balance / compensation factor (g sm ) into the side signal representative coding parameter (p side ). Ein Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass das Qualitäts-Kriterium auf ein Maß der kleinsten gemittelten Quadrate gegründet ist.A method according to claim 7, characterized that the quality criterion on a measure of the smallest averaged squares is. Ein Verfahren nach irgendeinem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass der Schritt des Kodierens des Seiten-Signals außerdem diesen Schritt umfasst: Skalieren des Seiten-Signals (xside) in eine Energie-Kontour des Haupt-Signals (xmono).A method according to any one of claims 1 to 8, characterized in that the step of encoding the side signal further comprises the step of: scaling the side signal (x side ) into an energy contour of the main signal (x mono ). Ein Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass die Skalierung des Seiten-Signals (xside) eine Division durch einen Faktor ist, welcher eine monotone kontinuierliche Funktion der Energie-Kontour des Haupt-Signals (xmono) ist.A method according to claim 9, characterized in that the scaling of the side signal (x side ) is a division by a factor which is a monotonous continuous function of the energy contour of the main signal (x mono ). Ein Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass die monotone kontinuierliche Funktion eine Quadratwurzel-Funktion ist.A method according to claim 10, characterized that the monotone continuous function has a square root function is. Ein Verfahren nach Anspruch 10 oder 11, dadurch gekennzeichnet, dass die Energie-Kontour, Ec, des Haupt-Signals, xmono, über einen Unter-Rahmen berechnet wird, entsprechend zu:
Figure 00360001
wobei L ein beliebiger Faktor, n ein Summierungs-Index, m die Probe innerhalb des Unter-Rahmens und w(n) eine Fenster-Funktion sind.
A method according to claim 10 or 11, characterized in that the energy contour, E c , of the main signal, x mono , is calculated via a sub-frame, corresponding to:
Figure 00360001
where L is an arbitrary factor, n is a summation index, m is the sample within the sub-frame, and w (n) is a window function.
Ein Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass die Fenster-Funktion eine rechtwinklige Fenster-Funktion ist.A method according to claim 12, characterized the window function is a rectangular window function. Ein Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass die Fenster-Funktion eine Hamming-Fenster-Funktion ist.A method according to claim 12, characterized that the window function is a Hamming window function. Ein Verfahren nach irgendeinem der Ansprüche 1 bis 14, dadurch gekennzeichnet, dass zumindest zwei Kodier-Schemata (81) verschiedene Kodier-Prinzipien des Seiten-Signals (xside) umfassen.A method according to any one of claims 1 to 14, characterized in that at least two coding schemes ( 81 ) comprise different coding principles of the side signal (x side ). Ein Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass zumindest ein erstes Kodier-Schema von den zumindest zwei Kodier-Schemata (81) ein erstes Kodier-Prinzip für das Seiten-Signal (xside) für alle Unter-Rahmen (90) und zumindest ein zweites Kodier-Schema von den zumindest zwei Kodier-Schemata (81) ein zweites Kodier-Prinzip für das Seiten-Signal (xside) für alle Unter-Rahmen (90) umfasst.A method according to claim 15, characterized in that at least one first coding scheme of the at least two coding schemes ( 81 ) a first coding principle for the side signal (x side ) for all sub-frames ( 90 ) and at least one second coding scheme of the at least two coding schemes ( 81 ) a second coding principle for the side signal (x side ) for all sub-frames ( 90 ). Ein Verfahren nach Anspruch 15 oder 16, dadurch gekennzeichnet, dass zumindest ein Kodier-Schema von den zumindest zwei Kodier-Schemata (81) das erste Kodier-Prinzip für das Seiten-Signal (xside) für einen Unter-Rahmen und das zweite Kodier-Prinzip für das Seiten-Signal (xside) für einen anderen Unter-Rahmen umfasst.A method according to claim 15 or 16, characterized in that at least one coding scheme of the at least two coding schemes ( 81 ) comprises the first encoding principle for the side signal (x side ) for a subframe and the second encoding principle for the side signal (x side ) for another subframe. Ein Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Schritt des Erzeugens (214) des zweiten Ausgabe-Signals (pside) wiederum diese Schritte umfasst: Analysieren der spektralen Charakteristik des Seiten-Signals (xside); Auswählen einer Gruppe von Unter-Rahmen (90), basierend auf der analysierten spektralen Charakteristik; Kodieren des Seiten-Signals (xside) getrennt innerhalb aller Unter-Rahmen (90) der ausgewählten Gruppe von Unter-Rahmen (90).A method according to claim 1, characterized in that the step of generating ( 214 ) of the second output signal (p side ) in turn comprises these steps: analyzing the spectral characteristic of the side signal (x side ); Select a group of subframes ( 90 ), based on the analyzed spectral characteristic; Encoding the side signal (x side ) separately within all sub-frames ( 90 ) of the selected group of subframes ( 90 ). Ein Verfahren nach irgendeinem der Ansprüche 1 bis 18, dadurch gekennzeichnet, dass der Schritt des Erzeugens (214) eines zweiten Ausgabe-Signals (pside) in einem begrenzten Frequenz-Band angewandt wird.A method according to any one of claims 1 to 18, characterized in that the step of generating ( 214 ) of a second output signal (p side ) in a limited frequency band. Ein Verfahren nach Anspruch 19, dadurch gekennzeichnet, dass der Schritt des Erzeugens (214) eines zweiten Ausgabe-Signals (pside) nur für Frequenzen unter 2 kHz angewandt wird.A method according to claim 19, characterized in that the step of generating ( 214 ) of a second output signal (p side ) is only applied for frequencies below 2 kHz. Ein Verfahren nach Anspruch 20, dadurch gekennzeichnet, dass der Schritt des Erzeugens (214) eines zweiten Ausgabe-Signals (pside) nur für Frequenzen unter 1 kHz angewandt wird.A method according to claim 20, characterized in that the step of generating ( 214 ) of a second output signal (p side ) is applied only for frequencies below 1 kHz. Ein Verfahren nach irgendeinem der Ansprüche 1 bis 21, dadurch gekennzeichnet, dass die Vielkanal-Audio-Signale Musik-Signale repräsentieren.A method according to any one of claims 1 to 21, characterized in that the multi-channel audio signals are music signals represent. Ein Verfahren des Dekodierens von Vielkanal-Audio-Signalen, umfassend die Schritte: Dekodieren (220) von Kodier-Parametern (pmono), die ein Haupt-Signal (xmono) repräsentieren, in ein dekodiertes Haupt-Signal (x''mono); wobei das Haupt-Signal (xmono) eine erste Linearkombination von Signalen von zumindest einem ersten und einem zweiten Kanal (a, b; L, R) ist; Dekodieren (224) von Kodier-Parametern (pside), die ein dekodiertes Seiten-Signal (xside) repräsentieren, in ein dekodiertes Seiten-Signal (x''side); wobei das Seiten-Signal (xside) eine zweite Linearkombination von Signalen von zumindest einem ersten und einem zweiten Kanal (a, b; L, R) innerhalb eines Unter-Rahmen (80) ist; und Kombinieren (226) von zumindest dem dekodierten Haupt-Signal (x''mono) und dem dekodierten Seiten-Signal (x''side) in Signale von zumindest dem ersten und dem zweiten Kanal (a, b; L, R), gekennzeichnet durch diesen Schritt: Bereitstellen (222) von zumindest zwei Kodier-Schemata (81), jedes von den zumindest zwei Kodier-Schemata (81) charakterisiert durch eine zugehörige Gruppe von Unter-Rahmen (90), wobei jede Gruppe von Unter-Rahmen den Kodier-Rahmen (80) bildet; wobei Unter-Rahmen (90) der Gruppen von Unter-Rahmen unterschiedliche Längen aufweisen; die Summe der Längen der Unter-Rahmen (90) in jedem Kodier-Schema (81) gleich ist zu der Länge des Kodier-Rahmens (80); jede Gruppe von Unter-Rahmen (90) zumindest einen Unter-Rahmen (90) umfasst; und wobei der Schritt des Dekodierens (224) der das Seiten-Signal repräsentierenden Kodier-Parameter (pside) wiederum den Schritt des Dekodierens der Kodier-Parameter (pside), welche das Seiten-Signal getrennt in den Unter-Rahmen (90) von einem der zumindest zwei Kodier-Schemata (81) repräsentieren, umfasst.A method of decoding multi-channel audio signals, comprising the steps of: decoding ( 220 ) of coding parameters (p mono ) representing a main signal (x mono ) into a decoded main signal (x '' mono ); wherein the main signal (x mono ) is a first linear combination of signals from at least a first and a second channel (a, b; L, R); Decode ( 224 ) encoding parameters (p side ) representing a decoded side signal (x side ) into a decoded side signal (x '' side ); wherein the side signal (x side ) comprises a second linear combination of signals from at least a first and a second channel (a, b, L, R) within a sub-frame ( 80 ); and Combine ( 226 ) of at least the main decoded signal (x " mono ) and the decoded side signal (x" side ) into signals from at least the first and second channels (a, b; L, R) characterized by this step : Provide ( 222 ) of at least two coding schemes ( 81 ), each of the at least two coding schemes ( 81 ) characterized by an associated group of subframes ( 90 ), where each group of subframes encodes the coding frame ( 80 ) forms; sub-frame ( 90 ) of the groups of subframes have different lengths; the sum of the lengths of subframes ( 90 ) in each coding scheme ( 81 ) is equal to the length of the coding frame ( 80 ); each group of subframes ( 90 ) at least one subframe ( 90 ); and wherein the step of decoding ( 224 ) the encoding parameter (p side ) representing the side signal again comprises the step of decoding the coding parameters (p side ) which separate the page signal into the subframe (p side ). 90 ) of one of the at least two coding schemes ( 81 ). Eine Kodier-Vorrichtung (14), umfassend: Eingabe-Mittel (16; 16A-C) für Vielkanal-Audio-Signale (a, b; L, R, C), umfassend zumindest einen ersten und einen zweiten Kanal (a, b; L, R); Mittel (38) für das Erzeugen eines ersten Ausgabe-Signals (pmono), welche ein Haupt-Signal (xmono) repräsentierende Kodier-Parameter sind, wobei das Haupt-Signal (xmono) eine erste Linearkombination von Signalen von zumindest dem ersten und dem zweiten Kanal (a, b; L, R) ist; Mittel (30) für das Erzeugen eines zweiten Ausgabe-Signals (pside), welche ein Seiten-Signal (xside) repräsentierende Kodier-Parameter sind, wobei das Seiten-Signal (xside) eine zweite Linearkombination von Signalen von zumindest dem ersten und dem zweiten Kanal (a, b; L, R) innerhalb eines Kodier-Rahmens (80) ist; und Ausgabe-Mittel (52); gekennzeichnet durch Mittel für das Bereitstellen von zumindest zwei Kodier-Schemata (81), jedes von den zumindest zwei Kodier-Schemata (81) charakterisiert durch eine zugehörige Gruppe von Unter-Rahmen (90), wobei jede Gruppe von Unter-Rahmen den Kodier-Rahmen (80) bildet, wobei Unter-Rahmen (90) der Gruppen von Unter-Rahmen unterschiedliche Längen aufweisen; die Summe der Längen der Unter-Rahmen (90) in jedem Kodier-Schema (81) gleich ist zu der Länge des Kodier-Rahmens (80); jede Gruppe von Unter-Rahmen (90) zumindest einen Unter-Rahmen (90) umfasst; wobei das Mittel (30) für das Erzeugen des zweiten Ausgabe-Signals (pside) wiederum Mittel (86; 87) umfasst für das Auswählen eines Kodier-Schemas, welches zumindest zu einem Teil von einem gegenwärtigen Signal-Inhalt des Seiten-Signals (xside) abhängt; Mittel für das Kodieren des Seiten-Signals (xside), getrennt in jedem der Unter-Rahmen (90) des ausgewählten Kodier-Schemas.A coding device ( 14 ), comprising: input means ( 16 ; 16A -C) for multi-channel audio signals (a, b; L, R, C) comprising at least a first and a second channel (a, b, L, R); Medium ( 38 ) for generating a first output signal (p mono ), which are coding parameters representing a main signal (x mono ), the main signal (x mono ) being a first linear combination of signals from at least the first and the second Channel (a, b; L, R); Medium ( 30 ) (For generating a second output signal p side), which are a side signal (x side) representing encoding parameters, wherein the side signal (x side) being a second linear combination of signals of at least the first and second Channel (a, b; L, R) within a coding frame ( 80 ); and output means ( 52 ); characterized by means for providing at least two coding schemes ( 81 ), each of the at least two coding schemes ( 81 ) characterized by an associated group of subframes ( 90 ), where each group of subframes encodes the coding frame ( 80 ), sub-frames ( 90 ) of the groups of subframes have different lengths; the sum of the lengths of subframes ( 90 ) in each coding scheme ( 81 ) is equal to the length of the coding frame ( 80 ); each group of subframes ( 90 ) at least one subframe ( 90 ); where the means ( 30 ) for generating the second output signal (p side ) again means ( 86 ; 87 ) for selecting a coding scheme which depends, at least in part, on a current signal content of the page signal (x side ); Means for coding the side signal (x side ) separated in each of the subframes ( 90 ) of the selected coding scheme. Die Dekodier-Vorrichtung (24), umfassend: Eingabe-Mittel (54) für Kodier-Parameter (pmono), repräsentierend ein Haupt-Signal, und Kodier-Parameter (pside), repräsentierend ein Seiten-Signal, wobei das Haupt-Signal (xmono) eine erste Linearkombination eines ersten und eines zweiten Kanals (a, b; L, R) ist; das Seiten-Signal (xside) eine zweite Linearkombination eines ersten und eines zweiten Kanals (a, b; L, R) ist; Mittel (64) für das Dekodieren der das Haupt-Signal repräsentierenden Kodier-Parameter (pmono) in ein dekodiertes Haupt-Signal (x''mono); Mittel (60) für das Dekodieren der das Seiten-Signal innerhalb eines Kodier-Rahmens (80) repräsentierenden Kodier-Parameter (pside) in ein dekodiertes Seiten-Signal (x''side); Mittel (68, 70) für das Kombinieren von zumindest des dekodierten Haupt-Signals (x''mono) und des dekodierten Seiten-Signals (x''side) in Signale von zumindest einem ersten und einem zweiten Kanal (a, b; L, R); und Ausgabe-Mittel (26; 26A-C), gekennzeichnet dadurch, dass das Mittel (60) für das Dekodieren der das Seiten-Signal repräsentierenden Kodier-Parameter (pside) wiederum umfasst: Mittel für das Bereitstellen von zumindest zwei Kodier-Schemata (81), jedes von den zumindest zwei Kodier-Schemata (81) charakterisiert durch eine zugehörige Gruppe von Unter-Rahmen (90), wobei jede Gruppe von Unter-Rahmen den Kodier-Rahmen (80) bildet, wobei Unter-Rahmen (90) der Gruppen von Unter-Rahmen unterschiedliche Längen aufweisen; die Summe der Längen der Unter-Rahmen (90) in jedem Kodier-Schema gleich ist zu der Länge des Kodier-Rahmens (80); jede Gruppe von Unter-Rahmen (90) zumindest einen Unter-Rahmen (90) umfasst; und das Mittel für das Dekodieren der das Seiten-Signal repräsentierenden Kodier-Parameter (pside), eingerichtet ist für das Dekodieren der Kodier-Parameter (pside), welche das Seiten-Signal getrennt in den Unter-Rahmen (90) von einem von den zumindest zwei Kodier-Schemata (81) repräsentieren.The decoding device ( 24 ), comprising: input means ( 54 ) for coding parameters (p mono ) representing a main signal, and coding parameters (p side ) representing a side signal, the main signal (x mono ) comprising a first linear combination of a first and a second channel (p mono ) a, b; L, R); the side signal (x side ) is a second linear combination of a first and a second channel (a, b, L, R); Medium ( 64 ) for decoding the coding signal (p mono ) representing the main signal into a decoded main signal (x '' mono ); Medium ( 60 ) for decoding the page signal within a coding frame ( 80 ) encoding parameter (p side ) into a decoded side signal (x '' side ); Medium ( 68 . 70 ) for combining at least the main decoded signal (x " mono ) and the decoded side signal (x" side ) into signals from at least a first and a second channel (a, b; L, R); and output means ( 26 ; 26A -C), characterized in that the means ( 60 ) for decoding the encoding parameter (p side ) representing the side signal, in turn comprises means for providing at least two coding schemes ( 81 ), each of the at least two coding schemes ( 81 ) characterized by an associated group of subframes ( 90 ), where each group of subframes encodes the coding frame ( 80 ), sub-frames ( 90 ) of the groups of subframes have different lengths; the sum of the lengths of subframes ( 90 ) in each coding scheme is equal to the length of the coding frame ( 80 ); each group of subframes ( 90 ) at least one subframe ( 90 ); and the means for decoding the encoding parameter (p side ) representing the page signal is arranged for decoding the encoding parameters (p side ) which separate the page signal into the subframe (p side ). 90 ) of one of the at least two coding schemes ( 81 ). Ein Audio-System (1), umfassend zumindest eines von diesen: eine Kodier-Vorrichtung (14) nach Anspruch 24, und eine Dekodier-Vorrichtung (24) nach Anspruch 25.An audio system ( 1 ) comprising at least one of them: a coding device ( 14 ) according to claim 24, and a decoding device ( 24 ) according to claim 25.
DE602004008613T 2003-12-19 2004-12-15 TREUE OPTIMIZED CODING WITH VARIABLE FRAME LENGTH Active DE602004008613T2 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SE0303501A SE0303501D0 (en) 2003-12-19 2003-12-19 Filter-based parametric multi-channel coding
SE0303501 2003-12-19
SE0400417 2004-02-20
SE0400417A SE527670C2 (en) 2003-12-19 2004-02-20 Natural fidelity optimized coding with variable frame length
PCT/SE2004/001867 WO2005059899A1 (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding

Publications (2)

Publication Number Publication Date
DE602004008613D1 DE602004008613D1 (en) 2007-10-11
DE602004008613T2 true DE602004008613T2 (en) 2008-06-12

Family

ID=31996354

Family Applications (2)

Application Number Title Priority Date Filing Date
DE602004008613T Active DE602004008613T2 (en) 2003-12-19 2004-12-15 TREUE OPTIMIZED CODING WITH VARIABLE FRAME LENGTH
DE602004023240T Active DE602004023240D1 (en) 2003-12-19 2004-12-15 Coding and decoding of multi-channel sound signals based on a main and sub signal representation

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE602004023240T Active DE602004023240D1 (en) 2003-12-19 2004-12-15 Coding and decoding of multi-channel sound signals based on a main and sub signal representation

Country Status (15)

Country Link
EP (2) EP1845519B1 (en)
JP (2) JP4335917B2 (en)
CN (2) CN100559465C (en)
AT (2) ATE443317T1 (en)
AU (1) AU2004298708B2 (en)
BR (2) BRPI0410856B8 (en)
CA (2) CA2690885C (en)
DE (2) DE602004008613T2 (en)
HK (2) HK1091585A1 (en)
MX (1) MXPA05012230A (en)
PL (1) PL1623411T3 (en)
RU (2) RU2305870C2 (en)
SE (1) SE527670C2 (en)
WO (1) WO2005059899A1 (en)
ZA (1) ZA200508980B (en)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2363116C2 (en) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Audio encoding
WO2006126858A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP4639966B2 (en) * 2005-05-31 2011-02-23 ヤマハ株式会社 Audio data compression method, audio data compression circuit, and audio data expansion circuit
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007004830A1 (en) 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1913578B1 (en) 2005-06-30 2012-08-01 LG Electronics Inc. Method and apparatus for decoding an audio signal
US8121836B2 (en) 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
JP5111375B2 (en) 2005-08-30 2013-01-09 エルジー エレクトロニクス インコーポレイティド Apparatus and method for encoding and decoding audio signals
US7987097B2 (en) 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
JP4859925B2 (en) 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド Audio signal decoding method and apparatus
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
WO2007040349A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
KR100857113B1 (en) 2005-10-05 2008-09-08 엘지전자 주식회사 Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US8204740B2 (en) 2006-02-06 2012-06-19 Telefonaktiebolaget Lm Ericsson (Publ) Variable frame offset coding
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
EP2124486A1 (en) * 2008-05-13 2009-11-25 Clemens Par Angle-dependent operating device or method for generating a pseudo-stereophonic audio signal
KR101629862B1 (en) * 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
JPWO2010016270A1 (en) * 2008-08-08 2012-01-19 パナソニック株式会社 Quantization apparatus, encoding apparatus, quantization method, and encoding method
US8676365B2 (en) * 2008-09-17 2014-03-18 Orange Pre-echo attenuation in a digital audio signal
JP5309944B2 (en) 2008-12-11 2013-10-09 富士通株式会社 Audio decoding apparatus, method, and program
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
JP5793675B2 (en) 2009-07-31 2015-10-14 パナソニックIpマネジメント株式会社 Encoding device and decoding device
JP5295380B2 (en) * 2009-10-20 2013-09-18 パナソニック株式会社 Encoding device, decoding device and methods thereof
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
WO2011076285A1 (en) * 2009-12-23 2011-06-30 Nokia Corporation Sparse audio
US8442837B2 (en) 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
EP2544466A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
KR102173422B1 (en) * 2012-11-15 2020-11-03 가부시키가이샤 엔.티.티.도코모 Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
US10060955B2 (en) * 2014-06-25 2018-08-28 Advanced Micro Devices, Inc. Calibrating power supply voltages using reference measurements from code loop executions
ES2904275T3 (en) 2015-09-25 2022-04-04 Voiceage Corp Method and system for decoding the left and right channels of a stereo sound signal
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
CN107742521B (en) 2016-08-10 2021-08-13 华为技术有限公司 Coding method and coder for multi-channel signal
CN109215668B (en) 2017-06-30 2021-01-05 华为技术有限公司 Method and device for encoding inter-channel phase difference parameters
CN115831130A (en) 2018-06-29 2023-03-21 华为技术有限公司 Coding method, decoding method, coding device and decoding device for stereo signal
CN112233682B (en) * 2019-06-29 2024-07-16 华为技术有限公司 Stereo encoding method, stereo decoding method and device

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (en) * 1991-02-01 1992-09-01 Philips Nv SUBBAND CODING DEVICE, AND A TRANSMITTER EQUIPPED WITH THE CODING DEVICE.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5694332A (en) * 1994-12-13 1997-12-02 Lsi Logic Corporation MPEG audio decoding system with subframe input buffering
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5796842A (en) * 1996-06-07 1998-08-18 That Corporation BTSC encoder
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP3335605B2 (en) * 2000-03-13 2002-10-21 日本電信電話株式会社 Stereo signal encoding method
DE60209888T2 (en) * 2001-05-08 2006-11-23 Koninklijke Philips Electronics N.V. CODING AN AUDIO SIGNAL
JP2003084790A (en) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd Speech component emphasizing device
CN1219415C (en) * 2002-07-23 2005-09-14 华南理工大学 5.1 path surround sound earphone repeat signal processing method

Also Published As

Publication number Publication date
CA2527971C (en) 2011-03-15
RU2425340C2 (en) 2011-07-27
RU2005134365A (en) 2006-05-27
HK1115665A1 (en) 2008-12-05
EP1845519A2 (en) 2007-10-17
RU2007121143A (en) 2008-12-10
EP1623411B1 (en) 2007-08-29
SE0400417L (en) 2005-06-20
AU2004298708B2 (en) 2008-01-03
PL1623411T3 (en) 2008-01-31
JP4589366B2 (en) 2010-12-01
DE602004008613D1 (en) 2007-10-11
ATE371924T1 (en) 2007-09-15
SE527670C2 (en) 2006-05-09
CN101118747B (en) 2011-02-23
JP2008026914A (en) 2008-02-07
BRPI0419281B1 (en) 2018-08-14
ATE443317T1 (en) 2009-10-15
SE0400417D0 (en) 2004-02-20
CN100559465C (en) 2009-11-11
ZA200508980B (en) 2007-03-28
BRPI0410856A (en) 2006-07-04
CN101118747A (en) 2008-02-06
DE602004023240D1 (en) 2009-10-29
RU2305870C2 (en) 2007-09-10
HK1091585A1 (en) 2007-01-19
CA2527971A1 (en) 2005-06-30
JP2007529021A (en) 2007-10-18
EP1845519B1 (en) 2009-09-16
EP1845519A3 (en) 2007-11-07
BRPI0410856B1 (en) 2019-10-01
MXPA05012230A (en) 2006-02-10
AU2004298708A1 (en) 2005-06-30
CA2690885C (en) 2014-01-21
CA2690885A1 (en) 2005-06-30
WO2005059899A1 (en) 2005-06-30
EP1623411A1 (en) 2006-02-08
CN1816847A (en) 2006-08-09
BRPI0410856B8 (en) 2019-10-15
JP4335917B2 (en) 2009-09-30

Similar Documents

Publication Publication Date Title
DE602004008613T2 (en) TREUE OPTIMIZED CODING WITH VARIABLE FRAME LENGTH
DE60206390T2 (en) EFFICIENT AND SCALABLE PARAMETRIC STEREOCODING FOR LOW-BITRATE APPLICATIONS
EP1864279B1 (en) Device and method for producing a data flow and for producing a multi-channel representation
DE60103424T2 (en) IMPROVING THE PERFORMANCE OF CODING SYSTEMS USING HIGH FREQUENCY RECONSTRUCTION PROCESSES
US7809579B2 (en) Fidelity-optimized variable frame length encoding
DE69731677T2 (en) Improved combination stereo coding with temporal envelope shaping
DE60310716T2 (en) SYSTEM FOR AUDIO CODING WITH FILLING OF SPECTRAL GAPS
DE69325952T2 (en) Coding and decoding of audio information
DE602004002390T2 (en) AUDIO CODING
DE602006000239T2 (en) ENERGY DEPENDENT QUANTIZATION FOR EFFICIENT CODING OF SPATIAL AUDIOPARAMETERS
DE69210689T2 (en) ENCODER / DECODER FOR MULTI-DIMENSIONAL SOUND FIELDS
DE69933659T2 (en) METHOD AND SYSTEM FOR SPATIAL CODING WITH LOW BITRATE
DE69431622T2 (en) METHOD AND DEVICE FOR ENCODING DIGITAL SOUND ENCODED WITH MULTIPLE BITS BY SUBTRACTING AN ADAPTIVE SHAKING SIGNAL, INSERTING HIDDEN CHANNEL BITS AND FILTERING, AND ENCODING DEVICE FOR USE IN THIS PROCESS
DE602005002833T2 (en) COMPENSATION OF MULTICANAL AUDIO ENERGY LOSSES
DE60013785T2 (en) IMPROVED SUBJECTIVE QUALITY OF SBR (SPECTRAL BAND REPLICATION) AND HFR (HIGH FREQUENCY RECONSTRUCTION) CODING PROCEDURES BY ADDING NOISE AND LIMITING NOISE REDUCTION
DE69432012T2 (en) Perceptual coding of audio signals
DE602005006424T2 (en) STEREO COMPATIBLE MULTICHANNEL AUDIO CODING
DE602004010885T2 (en) AUDIO-TRANS CODING
DE69810361T2 (en) Method and device for multi-channel acoustic signal coding and decoding
DE102005010057A1 (en) Apparatus and method for generating a coded stereo signal of an audio piece or audio data stream
DE102008009024A1 (en) Apparatus and method for synchronizing multichannel extension data with an audio signal and for processing the audio signal
EP2402943A2 (en) Method and device for creating an environmental signal
DE102007029381A1 (en) Digital signal e.g. audio signal, processing device, has decision section, which assumes forecast data before deletion as interpolation data, when absolute value is lower than resolution
DE102020210917B4 (en) Improved M/S stereo encoder and decoder
DE10065363B4 (en) Apparatus and method for decoding a coded data signal

Legal Events

Date Code Title Description
8364 No opposition during term of opposition