DE602004008613T2

DE602004008613T2 - TREUE OPTIMIZED CODING WITH VARIABLE FRAME LENGTH

Info

Publication number: DE602004008613T2
Application number: DE602004008613T
Authority: DE
Inventors: Stefan Bruhn; Ingemar Johansson; Anisse Taleb; Daniel ENSTRÖM
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2003-12-19
Filing date: 2004-12-15
Publication date: 2008-06-12
Anticipated expiration: 2024-12-16
Also published as: JP2007529021A; RU2007121143A; WO2005059899A1; DE602004008613D1; JP4335917B2; RU2305870C2; BRPI0410856B8; CA2527971C; PL1623411T3; CN1816847A; BRPI0410856A; HK1115665A1; MXPA05012230A; HK1091585A1; AU2004298708B2; CN100559465C; AU2004298708A1; RU2005134365A; EP1845519A3; JP2008026914A

Abstract

A method of encoding multi-channel audio signals comprises generating of a first output signal (x' mono ), being encoding (38) parameters representing a main signal (x mono ). The main signal (x mono ) is a first linear combination (34) of signals (16A,16B) of at least a first and a second channel. The method further comprises generating (30) of a second output signal (p side ), being encoding parameters representing a side signal (x side ). The side signal (x side ) is a second linear combination (36) of signals (16A,16B) of at least the first and the second channel within an encoding frame. The method is characterised in that the generating of the second output signal further comprises scaling of the side signal (x side ) to an energy contour of the main signal (x mono ). A method of decoding is also presented as well as an encoder, a decoder and audio system, all according to the same basic idea.

Description

TECHNISCHES GEBIETTECHNICAL AREA

Die vorliegende Erfindung betrifft allgemein das Kodieren von Audio-Signalen und speziell das Kodieren von Viel-Kanal-Audio-Signalen.The The present invention relates generally to the coding of audio signals and especially the coding of multi-channel audio signals.

HINTERGRUNDBACKGROUND

Es besteht ein großer Bedarf am Markt für das Übertragen und Speichern von Audio-Signalen bei niedriger Bit-Rate, während hohe Audio-Qualität beibehalten wird. Besonders in Fällen, in welchen Übertragungs-Ressourcen oder Speicher begrenzt sind, ist der Betrieb bei niedriger Bit-Rate ein essentieller Kostenfaktor. Dieses ist typisch der Fall z. B. bei Strom- und Mitteilungs-Applikationen in Mobil-Kommunikations-Systemen, solchen wie GSM, UMTS oder CDMA.It there is a big one Demand on the market for the transferring and storing audio signals at low bit rate while high Audio Quality is maintained. Especially in cases in which transmission resources or memory is limited, the operation is at low bit rate an essential cost factor. This is typical of the case z. B. in power and messaging applications in mobile communication systems, such as GSM, UMTS or CDMA.

Gegenwärtig sind keine standardisierten Kodierer-Dekodierer verfügbar, bereitstellend hohe stereophone Audio-Qualität bei Bit-Raten, welche ökonomisch interessant für die Verwendung in Mobil-Kommunikations-Systemen sind. Was möglich ist mit verfügbaren Kodierern/Dekodierern, ist monophone Übertragung der Audio-Signale. In einem gewissen Maß ist auch stereophone Übertragung verfügbar. Jedoch, Bit-Raten-Begrenzungen erfordern es gewöhnlich die Stereo-Präsentation drastisch zu begrenzen.Present are no standardized encoder-decoder available, providing high stereophonic Audio Quality at bit rates, which is economical interesting for which are use in mobile communication systems. Which is possible with available Encoders / decoders, is monophonic transmission of audio signals. To some extent also stereophonic transmission available. However, bit rate limits usually require the stereo presentation drastically limit.

Der einfachste Weg, des stereophonen- oder Vielkanal-Kodierens von Audio-Signalen ist es, die Signale von verschiedenen Kanälen getrennt als individuelle und unabhängige Signale zu kodieren. Ein anderer grundsätzlicher Weg, verwendet in Stereo-FM-Funk-Übertragung, der auch Kompatibilität mit legalen Mono-Funk-Empfängern sichert, ist ein Summen- und ein Differenz-Signal der zwei involvierten Kanäle zu übertragen.Of the simplest way of stereophonic or multi-channel coding of audio signals is to the signals from different channels separated as individual and independent Encode signals. Another fundamental way, used in Stereo FM radio transmission, which also has compatibility with legal mono-radio receivers saves, a sum and a difference signal of the two channels involved is to be transmitted.

Kodierer/Dekodierer des Stands der Technik, solche wie MPEG-1/2 Layer III und MPEG-2/4 AAC verwenden so genanntes gemeinsames Stereo-Kodieren. Entsprechend dieser Technik werden die Signale der verschiedenen Kanäle gemeinsam verarbeitet, anstatt getrennt und individuell. Die beiden am meisten verwendeten Techniken der gemeinsamen Stereo-Kodierung sind bekannt als „Mitte/Seite" (M/S) Stereo-Kodierung und Intensitäts-Stereo-Kodierung, welche gewöhnlich auf Sub-Bänder der zu kodierenden Stereo- oder Vielkanal-Signale angewandt werden.Encoder / decoder of the prior art, such as MPEG-1/2 Layer III and MPEG-2/4 AAC use so-called common stereo coding. According to this technique the signals of the different channels are processed together instead of separate and individual. The two most used techniques the common stereo coding are known as "mid / side" (M / S) stereo coding and intensity stereo coding, which usually on sub-bands the stereo or multi-channel signals to be coded are used.

M/S Stereo-Kodierung ist ähnlich der beschriebenen Prozedur für Stereo-FM-Funk, in einem Sinne, dass diese die Summen- und Differenz-Signale der Kanal-Sub-Bänder kodiert und überträgt und dadurch Redundanz zwischen den Sub-Bändern ausnutzt. Die Struktur und der Betrieb eines Kodierers basierend auf M/S-Stereo-Kodierung ist beschrienen z. B. in US Patent 5,285,489 durch J. D. Johnston.M / S stereo coding is similar to the procedure described for stereo FM radio in the sense that it encodes and transmits the sum and difference signals of the channel sub-bands, thereby exploiting redundancy between the sub-bands. The structure and operation of a coder based on M / S stereo coding is described e.g. In U.S. Patent 5,285,489 by JD Johnston.

Intensitäts-Stereo-Kodierung ist andererseits fähig Stereo-Irrelevanz zu nutzen. Es überträgt die gemeinsame Intensität der Kanäle (der verschiedenen Sub-Bänder) zusammen mit einiger Ortsinformation, anzeigend, wie die Intensität unter den Kanälen verteilt ist. Intensitäts-Stereo-Kodierung liefert nur Information zur spektralen Intensität der Kanäle. Phasen-Information wird nicht transportiert. Aus diesem Grund und da die zeitliche Zwischen-Kanal-Information (genauer die Zeit-Differenz zwischen Kanälen) von größerer Psychoakustischer Relevanz ist, insbesondere bei niedrigeren Frequenzen, kann Intensitäts-Stereo-Kodierung nur bei hohen Frequenzen über etwa 2 kHz verwendet werden. Ein Intensitäts-Stereo-Kodier-Verfahren ist beschrieben z. B. in dem Europäischen Patent 04974413 durch Veldhuis et al.On the other hand, intensity stereo coding is capable of using stereo irrelevance. It transmits the common intensity of the channels (the various sub-bands) along with some location information, indicating how the intensity is distributed among the channels. Intensity stereo coding provides only information about the spectral intensity of the channels. Phase information is not transported. For this reason and because the temporal inter-channel information (more precisely, the time difference between channels) is of greater psychoacoustic relevance, especially at lower frequencies, intensity stereo coding can only be used at high frequencies above about 2 kHz. An intensity stereo coding method is described, for. B. in the European Patent 04974413 by Veldhuis et al.

Ein kürzlich entwickeltes Stereo-Kodierungs-Verfahren ist beschrieben z. B. in einer Konferenz-Veröffentlichung mit dem Titel „Binaural cue coding applied stereo and multi-channel audio compression", 112th AES convention, May 2002, Munich, Germany durch C. Faller et al. Dieses Verfahren ist ein Verfahren für parametrische Viel-Kanal-Audio-Kodierung. Das grundlegende Prinzip ist, dass auf der Seite der Kodierung die Signale von N Kanälen c1, c2, ... cn in ein Mono-Signal m kombiniert werden. Das Mono-Signal ist Audio-kodiert, unter Verwendung irgendeines konventionellen monophonen Audio-Kodierers/Dekodierers. Parallel werden Parameter aus den Kanal-Signalen abgeleitet, welche das Viel-Kanal-Bild beschreiben. Die Parameter werden kodiert und übertragen an den Dekodierer, zusammen mit dem Audio-Bit-Strom. Der Dekodierer dekodiert zuerst das Mono-Signal m' und regeneriert die Kanal-Signale c1', c2', ..., cN', basierend auf der parametrischen Beschreibung des Viel-Kanal-Bildes.One recently developed stereo coding method is described for. In a conference publication entitled "Binaural cue coding applied stereo and multi-channel audio compression ", 112th AES convention, May 2002, Munich, Germany by C. Faller et al. This method is a procedure for parametric multi-channel audio coding. The basic principle is that on the coding side the signals of N channels c1, c2, ... cn be combined into a mono signal m. The mono signal is audio encoded, using any conventional one monophonic audio encoder / decoder. In parallel, parameters are derived from the channel signals, which describe the multi-channel image. The parameters are coded and transmitted to the decoder, along with the audio bit stream. The decoder first decodes the mono signal m 'and regenerates the channel signals c1', c2 ', ..., cN' based on the parametric description of the multi-channel image.

Das Prinzip des ,Binaural Cue Coding' (BCC) besteht darin, dass es das kodierte Mono-Signal und so genannte BCC-Parameter überträgt. Die BCC-Parameter umfassen kodierte Niveau-Differenzen und Zeit-Differenzen zwischen den Kanälen für Sub-Bänder des originalen Viel-Kanal-Eingabe-Signals. Der Dekodierer erzeugt die verschiedenen Kanal-Signale wieder durch Anwenden von Niveau- und Phasen-Einstellungen pro Sub-Band, basierend auf den BCC-Parametern. Der Vorteil gegenüber z. B. M/S oder Intensitäts-Stereo ist, dass die Stereo-Information, umfassend zeitliche Zwischen-Kanal-Information mit viel geringeren Bit-Raten übertragen wird. Jedoch erfordert diese Technik hinsichtlich der Berechnung anspruchsvolle Zeit-Frequenz-Transformationen für jeden der Kanäle, sowohl im Kodierer als auch im Dekodierer.The principle of 'Binaural Cue Coding' (BCC) is that it is the encoded mono signal and so on transmits said BCC parameter. The BCC parameters include coded level differences and time differences between the channels for sub-bands of the original multi-channel input signal. The decoder re-generates the various channel signals by applying level and phase adjustments per sub-band based on the BCC parameters. The advantage over z. M / S or intensity stereo is that the stereo information comprising inter-channel temporal information is transmitted at much lower bit rates. However, this technique requires sophisticated time-frequency transforms for each of the channels in terms of computation, both in the encoder and in the decoder.

Darüber hinaus handhabt BCC nicht die Tatsache, dass eine Menge der Stereo-Information, speziell bei niedrigen Frequenzen diffus ist, das bedeutet sie kommt nicht aus irgendeiner bestimmten Richtung. Diffuse Ton-Felder existieren in beiden Kanälen einer Stereo-Aufnahme, jedoch sind diese in einem großen Ausmaß nicht in Phase in Bezug zu einander. Wenn ein Algorithmus, ein solcher wie BCC, Aufzeichnungen mit einer großen Menge von diffusen Ton-Feldern unterworfen wird, wird das reproduzierte Stereo-Bild verwirrt, springend von links nach rechts, da der BCC-Algorithmus das Signal nur in bestimmten Frequenz-Bändern nach rechts oder links einordnen kann.Furthermore BCC does not handle the fact that a lot of the stereo information, especially at low frequencies is diffuse, that means it comes not from any direction. Diffuse tone fields exist in both channels a stereo recording, but these are not to a large extent in phase in relation to each other. If an algorithm, such a like BCC, subject records with a large amount of diffuse clay fields The reproduced stereo image is confused, jumping from left to right as the BCC algorithm the signal only in certain frequency bands to the right or left can classify.

Ein mögliches Mittel um das Stereo-Signal zu kodieren und gute Wiedergabe von diffusen Ton-Feldern sicher zu stellen, ist ein Kodier-Schema sehr ähnlich zu dem im FM-Stereo-Rundfunk angewendeten zu verwenden, nämlich die Mono-Signale (Links + Rechts) und die Differenz-Signale (Links-Rechts) getrennt zu kodieren.One potential Means to encode the stereo signal and good playback of To ensure diffuse sound fields, a coding scheme is very similar to in FM stereo broadcasting used, namely the mono signals (left + right) and the difference signals (left-right) to code separately.

Eine Technik, beschrieben in US-Patent 5,434,948 durch C. E. Holt et al., verwendet eine ähnliche Technik wie in BCC für das Kodieren des Mono-Signals und der Seiten-Information. In diesem Fall besteht die Seiten-Information aus Prädiktor-Filtern und optional einem Residuum-Signal. Die Prädiktor-Filter, abgeschätzt durch einen Algorithmus der kleinsten Quadrate, wenn angewandt auf das Mono-Signal, erlauben die Vorhersage von Viel-Kanal-Audio-Signalen. Mit dieser Technik ist man fähig, Kodierung sehr niedriger Bit-Raten von Viel-Kanal-Audio-Quellen zu erreichen, jedoch auf Kosten eines Qualitäts-Abfalles, wie weiter unten diskutiert.A technique described in U.S. Patent 5,434,948 by CE Holt et al., uses a similar technique as in BCC for coding the mono signal and the page information. In this case, the page information consists of predictor filters and optionally a residual signal. The predictor filters, estimated by a least squares algorithm when applied to the mono signal, allow the prediction of multi-channel audio signals. With this technique, one is able to achieve encoding of very low bit rates from multi-channel audio sources, but at the cost of a quality drop, as discussed below.

Letztlich, für die Vollständigkeit, ist eine Technik zu erwähnen, welche für 3-D-Audio verwendet wird. Diese Technik synthetisiert die rechten und linken Kanal-Signale durch Filtern der Ton-Quellen-Signale mit sogenannten Kopfbezogenen Filtern. Jedoch erfordert diese Technik, dass die verschiedenen Ton-Quellen-Signale getrennt sind, und kann deshalb nicht generell für Stereo- oder Viel-Kanal-Kodierung angewandt werden.Ultimately, for the Completeness, is a technique to mention which for 3-D audio is used. This technique synthesizes the right one and left channel signals by filtering the audio source signals so-called head-related filters. However, this technique requires that the different sound source signals are separate, and can therefore not generally for Stereo or multi-channel coding.

ZUSAMNENFASSUNGZUSAMNENFASSUNG

Ein Problem mit bestehenden Kodier-Schemata, basierend auf dem Kodieren von Rahmen von Signalen, speziell eines Haupt-Signals und eines oder mehreren Seiten-Signale, ist, dass die Unterteilung von Audio-Information in Rahmen unattraktive Empfindungs-Artefakte erzeugen kann. Das Unterteilen der Information in Rahmen relativ langer Dauer reduziert gewöhnlich die im Durchschnitt verlangte Bit-Rate. Dieses kann vorteilhaft sein z. B. für Musik, enthaltend einen große Menge von diffusem Ton. Jedoch, für Musik, reich an Übergängen oder Sprache, werden schnelle zeitliche Variationen verschmiert werden über die Dauer des Rahmens, verursachend gespensterhafte Töne oder auch Vor-Echo-Probleme. Das Kodieren kurzer Rahmen wird statt dessen eine genauere Präsentation des Tons ergeben, minimierend die Energie, erfordert aber höhere Übertragungs-Bit-Raten und größere Berechnungs-Kapazitäten. Die Kodierungs-Effizienz als solche kann sich mit sehr kurzen Rahmen-Längen auch verringern. Die Einführung von mehr Rahmen-Grenzen kann auch Diskontinuitäten in Kodier-Parametern einführen, welche als Wahrnehmungs-Artefakte erscheinen können.One Problem with existing coding schemes based on coding of frames of signals, especially a main signal and one or more side signals, is that the subdivision of audio information in frame unattractive Can produce sensation artifacts. Dividing the information in a relatively long duration usually reduces the average demanded bit rate. This can be advantageous for. For music, containing a large one Amount of diffused clay. However, for music, rich in transitions or Language, fast temporal variations will be smeared over the Duration of the frame, causing ghostly sounds or also pre-echo problems. Encoding short frames will instead be a more accurate presentation of the sound, minimizing the energy but requiring higher transmission bit rates and larger calculation capacities. The Encoding efficiency as such can vary with very short frame lengths as well reduce. The introduction more frame boundaries may also introduce discontinuities in encoding parameters can appear as perceptual artifacts.

Ein weiteres Problem mit Schemata, basierend auf dem Kodieren eines Haupt-Signals und eines oder einiger Seiten-Signale ist, dass diese häufig relativ große Berechnungs-Kapazitäten erfordern. Insbesondere, wenn kurze Rahmen verwendet werden, ist das Handhaben von Diskontinuitäten in den Parametern von einem Rahmen zu einem anderen eine komplexe Aufgabe. Wenn lange Rahmen verwendet werden, können Abschätzungs-Fehler von Ton-Übergängen sehr große Seiten-Signale verursachen, welche wiederum den Bedarf an Übertragungs-Rate erhöhen.One Another problem with schemes based on coding a Main signal and one or more side signals is that these often relatively large Calculation capacity require. In particular, when short frames are used is managing discontinuities in the parameters from one frame to another a complex one Task. When long frames are used, estimation errors of tone transitions can be very high size Cause side signals, which in turn reduces the need for transmission rate increase.

Ein Ziel der vorliegenden Erfindung ist es daher, ein Kodier-Verfahren und eine Vorrichtung bereitzustellen, verbessernd die Wahrnehmungs-Qualität von Viel-Kanal-Audio-Signalen, insbesondere um Artefakte zu vermeiden, solche wie Vor-Echo, gespensterhafte Töne oder Rahmen-Diskontinuitäts-Artefakte. Ein weiteres Ziel der vorliegenden Erfindung ist es, ein Kodier-Verfahren und eine Vorrichtung bereitzustellen, welche geringere Verarbeitungs-Leistung erfordern und konstantere Übertragungs-Bit-Raten-Anforderungen haben.One The aim of the present invention is therefore to provide a coding method and a Device to improve the perceptual quality of multi-channel audio signals, especially to avoid artifacts, such as pre-echo, ghostly Sounds or Frame discontinuity artefacts. Another object of the present invention is an encoding method and to provide a device which has lower processing power require and more constant transmission bit rate requirements to have.

Die obigen Ziele werden erreicht durch Verfahren und Vorrichtungen entsprechend den anhängenden Patentansprüchen. Allgemein ausgedrückt: Polyphone Signale werden verwendet, um ein Haupt-Signal, typisch ein Mono-Signal, und ein Seiten-Signal zu erzeugen. Das Haupt-Signal wird entsprechend zu Kodier-Prinzipien des Stands der Technik kodiert. Eine Anzahl von Kodier-Schemata für das Seiten-Signal wird bereitgestellt. Jedes Kodier-Schema ist gekennzeichnet durch eine Gruppe von Unter-Rahmen verschiedener Längen. Die gesamte Länge der Unter-Rahmen korrespondiert zu der Länge des Kodier-Rahmens des Kodier-Schemas. Die Gruppen von Unter-Rahmen umfassen zumindest einen Unter-Rahmen. Das für das Seiten-Signal zu verwendende Kodier-Schema wird ausgewählt, zumindest teilweise abhängig von dem gegenwärtigen Signal-Inhalt der polyphonen Signale.The The above objects are achieved by methods and devices accordingly the appended claims. Generally words Polyphonic signals are used to produce a main signal, typical a mono signal, and a side signal to create. The main signal becomes according to coding principles of the prior art coded. A number of coding schemes for the Page signal is provided. Each coding scheme is marked by a group of sub-frames of different lengths. The whole length the sub-frame corresponds to the length of the coding frame of the Coding scheme. The groups of subframes include at least one subframe. That for the encoding scheme to be used for the page signal is selected, at least partially dependent from the present Signal content of the polyphonic signals.

In einer Ausführungsform findet die Auswahl vor dem Kodieren statt, basierend auf Analyse der Signal-Eigenschaften. In einer anderen Ausführungsform wird das Seiten-Signal kodiert durch jedes der Kodier-Schemata und dann wird basierend auf Messungen der Qualität der Kodierung das beste Kodier-Schema ausgewählt.In an embodiment the selection takes place before coding, based on analysis the signal properties. In another embodiment, the page signal encoded by each of the coding schemes and then being based on quality measurements coding the best coding scheme selected.

In einer bevorzugten Ausführungsform wird ein Residuum-Signal erzeugt als eine Differenz zwischen dem Seiten-Signal und dem mit einem Abgleich/Ausgleichs-Faktor skalierten Haupt-Signal. Der Abgleich/Ausgleichs-Faktor wird ausgewählt, um das Seiten-Residuum-Signal zu minimieren. Das optimierte Seiten-Residuum-Signal und der Abgleich/Ausgleichs-Faktor werden kodiert und als das Seiten-Signal repräsentierende Parameter bereitgestellt. Auf der Dekodierer-Seite werden der Abgleich/Ausgleichs-Faktor, das Seiten-Residuum-Signal und das Haupt-Signal verwendet, um das Seiten-Signal wieder herzustellen.In a preferred embodiment a residual signal is generated as a difference between the Page signal and the scaled with a balance / compensation factor Main signal. The balance / compensation factor is selected to to minimize the page residual signal. The optimized side residual signal and the adjustment / compensation factor is encoded and called the page signal representing parameters provided. On the decoder side, the balance / equalization factor, the side residual signal and the main signal used to get that Restore page signal.

In einer weiteren bevorzugten Ausführungsform umfasst das Kodieren des Seiten-Signals eine Energie-Kontur-Skalierung, um Vor-Echo-Effekte zu vermeiden. Außerdem können unterschiedliche Kodier-Schemata unterschiedliche Kodier-Prozeduren in den getrennten Unter-Rahmen umfassen.In a further preferred embodiment Encoding the side signal includes energy contour scaling to avoid pre-echo effects. You can also use different coding schemes different coding procedures in the separate sub-frames.

Der Haupt-Vorteil der vorliegenden Erfindung ist, dass die Erhaltung der Wahrnehmung/Empfindung der Audio-Signale verbessert ist. Außerdem erlaubt die vorliegende Erfindung auch die Übertragung von Viel-Kanal-Signalen bei sehr niedrigen Bit-Raten.Of the Main advantage of the present invention is that the conservation the perception / sensation of the audio signals is improved. Also allowed the present invention also involves the transmission of multi-channel signals at very low bit rates.

KURZE BESCHREIBUNG DER ZEICHNUNGENBRIEF DESCRIPTION OF THE DRAWINGS

Die Erfindung, zusammen mit deren weiteren Zielen und Vorteilen, kann am besten verstanden werden durch Bezugnahme af die folgende Beschreibung, genommen zusammen mit den begleitenden Zeichnungen, in welchen:The Invention, together with its other objectives and advantages, can are best understood by reference to the following description, taken together with the accompanying drawings, in which:

1 ein Block-Schema eines Systems für das Übertragen polyphoner Signale zeigt; 1 shows a block diagram of a system for transmitting polyphonic signals;

2a ein Block-Diagramm eines Kodierers in einem Sender ist; 2a a block diagram of an encoder in a transmitter;

2b ein Block-Diagramm eines Dekodierers in einem Empfänger ist; 2 B a block diagram of a decoder in a receiver;

3a ein Diagramm, illustrierend Kodier-Rahmen verschiedener Länge ist; 3a Figure 11 is a diagram illustrating coding frames of various lengths;

3b und 3c Block-Diagramme von Ausführungsformen von Seiten-Signal-Kodier-Einheiten entsprechend der vorliegenden Erfindung sind; 3b and 3c Block diagrams of embodiments of page signal encoding units according to the present invention are;

4 ein Block-Diagramm einer Ausführungsform eines Kodierers, verwendend Abgleich/Ausgleich-Faktor-Kodierung des Seiten-Signals, ist; 4 Fig. 12 is a block diagram of one embodiment of an encoder using adjustment / compensation factor coding of the side signal;

5 ein Block-Diagramm einer Ausführungsform eines Kodierers für Viel-Kanal-Systeme ist; 5 Figure 12 is a block diagram of one embodiment of a multi-channel system encoder;

6 ein Block-Diagramm einer Ausführungsform eines Kodierers, geeignet für das Dekodieren der Signale aus der Vorrichtung der 5, ist; 6 a block diagram of an embodiment of an encoder, suitable for decoding the signals from the device of 5 , is;

7a und 7b Diagramme, illustrierend Vor-Echo-Artefakte, sind; 7a and 7b Charts, illustrating pre-echo artifacts, are;

8 ein Block-Diagramm einer Ausführungsform einer Seiten-Signal-Kodier-Einheit entsprechend der vorliegenden Erfindung, einsetzend verschiedene Kodier-Prinzipien in verschiedenen Unter-Rahmen, ist; 8th a block diagram of one embodiment of a page signal encoding unit according to the present invention employing different coding principles in different subframes;

9 die Verwendung von verschiedenen Kodier-Prinzipien in verschiedenen Frequenz-Sub-Bändern illustriert; 9 illustrates the use of different coding principles in different frequency sub-bands;

10 ein Fluss-Diagramm der grundlegenden Schritte einer Ausführungsform eines Kodier-Verfahrens entsprechend der vorliegenden Erfindung ist; und 10 Fig. 10 is a flow chart of the basic steps of one embodiment of a coding method according to the present invention; and

11 ein Fluss-Diagramm der grundlegenden Schritte einer Ausführungsform eines Dekodier-Verfahrens entsprechend der vorliegenden Erfindung ist. 11 Fig. 10 is a flow chart of the basic steps of one embodiment of a decoding method according to the present invention.

DETAILLIERTE BESCHREIBUNGDETAILED DESCRIPTION

1 illustriert ein typisches System 1, in welchem die vorliegende Erfindung vorteilhaft verwendet werden kann. Ein Sender 10 enthält eine Antenne 12, einschließend assoziierte Hardware und Software, um fähig zu sein Funk-Signale 5 an einen Empfänger 20 zu senden. Der Sender 10 enthält unter anderen Teilen einen Viel-Kanal-Kodierer 14, welcher die Signale einer Anzahl von Eingabe-Kanälen 16 in Ausgabe-Signale, geeignet für Funk-Übertragung, transformiert. Beispiele von geeigneten Viel-Kanal-Kodierern 14 werden weiter unten im Detail beschrieben. Die Signale der Eingabe-Kanäle 16 können z. B. von einem Audio-Signal-Speicher 18, einem solchen wie einer Daten-Datei der digitalen Repräsentation von Audio-Aufzeichnungen, von Magnetband- oder Vinyl-Scheiben-Aufzeichnungen von Audio etc. geliefert werden. Die Signale der Eingabe-Kanäle 16 können auch „Live", z. B. aus einer Gruppe von Mikrophonen 19 geliefert werden. Die Audio-Signale sind digitalisiert, wenn nicht bereits in digitaler Form, bevor diese in den Viel-Kanal-Kodierer 14 eintreten. 1 illustrates a typical system 1 in which the present invention can be used to advantage. A transmitter 10 contains an antenna 12 Including associated hardware and software to be able to transmit radio signals 5 to a receiver 20 to send. The transmitter 10 contains among other parts a multi-channel encoder 14 representing the signals of a number of input channels 16 in output signals, suitable for radio transmission, transformed. Examples of suitable multi-channel encoders 14 will be described in detail below. The signals of the input channels 16 can z. B. from an audio signal memory 18 , such as a data file of the digital representation of audio recordings, of magnetic tape or vinyl-disk recordings of audio, etc. The signals of the input channels 16 can also be "live", for example from a group of microphones 19 to be delivered. The audio signals are digitized, if not already in digital form, before those in the multi-channel coder 14 enter.

Auf der Seite des Empfängers 20 handhabt eine Antenne 22 mit assoziierter Hardware und Software den tatsächlichen Empfang von Funk-Signalen 5, repräsentierend polyphone Audio-Signale. Hier werden typische Funktionalitäten, solche wie Fehler-Korrektur ausgeführt. Ein Dekodierer 24 dekodiert die empfangenen Funk-Signale 5 und transformiert die durch diese transportierten Audio-Daten in Signale einer Anzahl von Ausgabe-Kanälen 26. Die Ausgabe-Signale können geliefert werden z. B. an Lautsprecher 29 für sofortige Präsentation oder können in einem Audio-Signal-Speicher 28 beliebiger Art gespeichert werden.On the side of the recipient 20 handles an antenna 22 with associated hardware and software, the actual reception of radio signals 5 representing polyphonic audio signals. Typical functions, such as error correction, are executed here. A decoder 24 decodes the received radio signals 5 and transforms the audio data transported thereby into signals of a number of output channels 26 , The output signals can be supplied e.g. B. to speakers 29 for instant presentation or can be in an audio signal memory 28 be stored of any kind.

Das System 1 kann zum Beispiel ein Telefon-Konferenz-System, ein System für das Bereitstellen von Audio-Diensten oder anderen Audio-Applikationen sein. In einigen Systemen, solchen wie z. B. dem Telefon-Konferenz-System, muss die Kommunikation von einem Duplex-Typ sein, während z. B. die Verteilung von Musik von einem Dienst-Bereitsteller an einen Dienst-Abnehmer im Wesentlichen vom Ein-Weg-Typ sein kann. Die Übertragung von Signalen von dem Sender 10 an den Empfänger 20 kann auch durch irgendwelche anderen Mittel, z. B. unterschiedliche Arten von elektromagnetischen Wellen, Kabel oder Fasern, wie auch durch Kombinationen von diesen ausgeführt werden.The system 1 may be, for example, a telephone conference system, a system for providing audio services or other audio applications. In some systems, such as. As the telephone conference system, the communication must be of a duplex type, while z. For example, the distribution of music from a service provider to a service customer may be essentially one-way. The transmission of signals from the transmitter 10 to the recipient 20 can also by any other means, for. As different types of electromagnetic waves, cables or fibers, as well as by combinations of these are performed.

2a illustriert eine Ausführungsform eines Kodierers entsprechend der vorliegenden Ausführungsform. In dieser Ausführungsform ist das polyphone Signal ein Stereo-Signal, umfassend zwei Kanäle a und b, empfangen jeweils an den Eingängen 16A und 16B. Die Signale der Kanäle a und b werden an ein Vorverarbeitungs-Einheit 32 geliefert, in welcher verschiedene Signal-Konditionierungs-Prozeduren ausgeführt werden können. Die (vielleicht modifizierten) Signale aus der Ausgabe der Vorverarbeitungs-Einheit 32 werden in der Addier-Einheit 34 summiert. Diese Addier-Einheit 34 teilt auch die Summe durch einen Faktor 2. Das in dieser Weise erzeugte Signal x_mono ist ein Haupt-Signal des Stereo-Signals, da es im Wesentlichen alle Daten von beiden Kanälen umfasst. In dieser Ausführungsform repräsentiert das Haupt-Signal daher ein reines „mono"-Signal. Das Haupt-Signal x_mono wird an eine Haupt-Signal-Kodier-Einheit 38 geliefert, welche das Haupt-Signal entsprechend zu irgendwelchen geeigneten Kodier-Prinzipien kodiert. Solche Prinzipien sind innerhalb des Stands der Technik verfügbar und werden deshalb hier nicht weiter diskutiert. Die Haupt-Signal-Kodier-Einheit 38 liefert ein Ausgabe-Signal p_mono, bestehend aus ein Haupt-Signal repräsentierenden Kodier-Parametern. 2a illustrates an embodiment of an encoder according to the present embodiment. In this embodiment, the polyphonic signal is a stereo signal comprising two channels a and b, received at the inputs, respectively 16A and 16B , The signals of channels a and b are sent to a preprocessing unit 32 delivered, in which various signal conditioning procedures can be performed. The (perhaps modified) signals from the output of the preprocessing unit 32 be in the adder unit 34 summed. This adder unit 34 also divides the sum by a factor 2. The signal x _mono generated in this way is a main signal of the stereo signal, since it comprises substantially all data from both channels. Therefore, in this embodiment, the main signal represents a pure "mono" signal, and the main signal x _mono is sent to a main signal encoding unit 38 which encodes the main signal according to any suitable coding principles. Such principles are available within the state of the art and therefore will not be discussed further here. The main signal coding unit 38 provides an output signal p _mono consisting of coding parameters representing a main signal.

In einer Subtraktions-Einheit 36 wird eine Differenz (geteilt durch einen Faktor 2) der Kanal-Signale als ein Seiten-Signal x_side bereitgestellt. In dieser Ausführungsform repräsentiert das Seiten-Signal die Differenz zwischen den beiden Kanälen des Stereo-Signals. Das Seiten-Signal x_side wird an eine Seiten-Signal-Kodier-Einheit 30 geliefert. Bevorzugte Ausführungsformen der Seiten-Signal-Kodier-Einheit 30 werden weiter unten diskutiert werden. Entsprechend einer Seiten-Signal-Kodier-Prozedur, welche in größerem Detail weiter unten beschrieben werden wird, wird das Seiten-Signal x_side in die Kodier-Parameter p_side, repräsentierend ein Seiten-Signal x_side, übergeführt. In bestimmten Ausführungsformen findet dieses Kodieren auch unter Verwendung der Information des Haupt-Signals x_mono statt. Der Pfeil 42 zeigt eine solche Einrichtung, bei welcher das originale nicht kodierte Signal x_mono verwendet wird. In weiteren andersartigen Ausführungsformen kann die Haupt-Signal-Information, welche in der Seiten-Signal-Kodier-Einheit 30 verwendet wird, aus den Kodier-Parametern p_mono, repräsentierend das Haupt-Signal, abgeleitet werden, wie durch die unterbrochene Linie 44 angezeigt.In a subtraction unit 36 For example, a difference (divided by a factor of 2) of the channel signals is provided as a side signal x _side . In this embodiment, the side signal represents the difference between the two channels of the stereo signal. The page signal x _side is sent to a page signal encoding unit 30 delivered. Preferred embodiments of the side signal coding unit 30 will be discussed below. In accordance with a page signal encoding procedure, which will be described in more detail below, the page signal x _{side is converted} to the encode parameters p _side representing a page signal x _side . In certain embodiments, this coding also takes place using the information of the main signal x _mono . The arrow 42 shows such a device in which the original unencoded signal x _mono is used. In other different embodiments, the main signal information contained in the page signal encoding unit 30 is derived from the coding parameters p _mono representing the main signal, as deduced by the broken line 44 displayed.

Die Kodierungs-Parameter p_mono, repräsentierend das Haupt-Signal x_mono, sind ein erstes Ausgabe-Signal und die Kodierungs-Parameter p_side repräsentieren das Seiten-Signal x_side in einem zweiten Ausgabe-Signal. In einem typischen Fall werden diese zwei Ausgabe-Signale p_mono, p_side, zusammen den vollen Stereo-Ton repräsentierend, in ein Übertragungs-Signal 52 in einer Multiplexer-Einheit 40 gemultiplext. Jedoch kann in anderen Ausführungsformen die Übertragung der ersten und zweiten Ausgabe-Signale p_mono, p_side getrennt stattfinden.The coding parameters p _mono representing the main signal x _mono are a first output signal and the coding parameters p _side represent the side signal x _side in a second output signal. In a typical case, these two output signals p _mono , p _side , together representing the full stereo sound, become a transmission signal 52 in a multiplexer unit 40 multiplexed. However, in other embodiments, the transmission of the first and second output signals p _mono , p _{side may} take place separately.

In 2b ist eine Ausführungsform eines Dekodierers 24 entsprechend der vorliegenden Erfindung als ein Block-Schema illustriert. Das empfangene Signal 54, enthaltend Kodier-Parameter repräsentierend die Haupt-Signal- und Seiten-Signal-Information, wird an eine Demultiplexer-Einheit 56 geliefert, welche jeweils ein erstes und ein zweites Eingabe-Signal trennt. Das erste Eingabe-Signal, korrespondierend zu den Kodier-Parametern p_mono eines Haupt-Signals, wird an eine Haupt-Signal-Dekodier-Einheit 64 geliefert. In einer konventionellen Weise werden die Kodier-Parameter p_mono, repräsentierend das Haupt-Signal, verwendet, um ein dekodiertes Haupt-Signal x''_mono zu erzeugen, welches so ähnlich wie möglich dem Haupt-Signal x_mono (2a) des Kodierers 14 (2a) ist.In 2 B is an embodiment of a decoder 24 illustrated as a block scheme according to the present invention. The received signal 54 comprising coding parameters representing the main signal and side signal information, is sent to a demultiplexer unit 56 which separates a first and a second input signal, respectively. The first input signal, corresponding to the coding parameters p _{mono of} a main signal, is sent to a main signal decoding unit 64 delivered. In a conventional manner, the coding parameters p _mono representing the main signal are used to _mono generate a decoded main signal x "which is as similar as possible to the main signal x _mono ( 2a ) of the encoder 14 ( 2a ).

Ähnlich wird das zweite Eingabe-Signal, korrespondierend zu einem Seiten-Signal, an eine Seiten-Signal-Dekodier-Einheit 60 geliefert. Hier werden die Kodier-Parameter p_side, repräsentierend das Seiten-Signal, verwendet, um das dekodierte Seiten-Signal x''_side wiederherzustellen. In einigen Ausführungsformen verwendet die Dekodier-Prozedur Information über das Haupt-Signal x''_mono, wie durch den Pfeil 65 angezeigt.Similarly, the second input signal corresponding to a page signal is sent to a page signal decoder unit 60 delivered. Here, the encode parameters p _side representing the page signal are used to restore the decoded side signal x " _side . In some embodiments, the decoding procedure uses information about the main signal x " _mono , as indicated by the arrow 65 displayed.

Die dekodierten Haupt- und Seiten-Signale x''_mono und x''_side werden an eine Addier-Einheit 70 geliefert, welche ein Ausgabe-Signal bereitstellt, welches eine Repräsentation des originalen Signals des Kanals a ist, Ähnlich liefert eine durch eine Subtraktions-Einheit 68 bereitgestellte Differenz ein Ausgabe-Signal, welches eine Repräsentation des originalen Signals des Kanals b ist. Diese Kanal-Signale können nach-verarbeitet werden in einer Nach-Verarbeitungs-Einheit 74 entsprechend zu Signal-Verarbeitungs-Prozeduren des Stands der Technik. Letztlich werden die Kanal-Signale a und b an den Ausgängen 26A und 26B des Dekodierers bereitgestellt.The decoded main and side signals x " _mono and x" _side are sent to an adder unit 70 which provides an output signal which is a representation of the original signal of channel a, similarly provides one by a subtraction unit 68 provided difference an output signal, which is a representation of the original signal of the channel b. These channel signals can be post-processed in a post-processing unit 74 according to signal processing procedures of the prior art. Finally, the channel signals a and b at the outputs 26A and 26B provided by the decoder.

Wie in der Zusammenfassung erwähnt, wird das Kodieren typisch zu einer Zeit in einem Rahmen ausgeführt. Ein Rahmen enthält Audio-Abtastungen(Samples) innerhalb einer vordefinierten Zeitspanne. In dem unteren Teil der 3a ist ein Rahmen SF2 der Zeit-Dauer L illustriert. Die Audio-Abtastungen innerhalb des nicht gestrichelten Bereichs sind zusammen zu kodieren. Die vorangehenden und die nachfolgenden Abtastungen werden in anderen Rahmen kodiert. Die Aufteilung der Abtastungen in Rahmen wird auf jeden Fall einige Diskontinuitäten an den Rahmen-Grenzen erzeugen. Das Verschieben von Tönen wird das Verschieben von Kodier-Parametern ergeben, welche sich grundsätzlich an jeder Rahmen-Grenze verändern. Dieses wird Anlass für wahrnehmbare Fehler geben. Ein Weg, um dieses etwas zu kompensieren ist, das Kodieren nicht nur auf die zu kodierenden Abtastungen zu basieren, sondern auch auf Abtastungen in der direkten Nachbarschaft des Rahmens, wie durch die gestrichelten Bereiche angezeigt. Auf diese Weise wird es einen sanfteren Übergang zwischen den verschiedenen Rahmen geben. Als eine Alternative oder Ergänzung werden manchmal auch Interpolations-Techniken für das Verringern von durch Rahmen-Grenzen verursachten Wahrnehmungs-Artefakten verwendet. Jedoch, alle diese Prozeduren erfordern große zusätzliche Berechnungs-Ressourcen und für bestimmte spezielle Dekodier-Techniken kann es auch schwer sein irgendwelche Ressourcen bereitzustellen.As mentioned in the summary, coding is typically performed at one time in a frame. A frame contains audio samples within a predefined period of time. In the lower part of the 3a a frame SF2 of the time duration L is illustrated. The audio samples within the non-dashed area are to be coded together. The preceding and following samples are encoded in different frames. The division of samples into frames will definitely create some discontinuities at the frame boundaries. Moving sounds will result in shifting of coding parameters which basically change at each frame boundary. This will give rise to perceptible errors. One way to compensate for this is to base the coding not only on the samples to be coded, but also on samples in the immediate vicinity of the frame, as indicated by the dashed areas. In this way, there will be a smoother transition between the different frames. As an alternative or supplement, interpolation techniques are sometimes used to reduce perceptual artifacts caused by framing boundaries. However, all of these procedures require large additional computational resources, and for certain special decoding techniques, it may also be difficult to provide any resources.

Angesichts dessen ist es vorteilhaft möglichst lange Rahmen zu verwenden, da dann die Anzahl der Rahmen-Grenzen klein sein wird. Auch wird die Kodier-Effizienz typisch hoch und die erforderliche Übertragungs-Bit-Rate wird typisch minimiert sein. Jedoch lange Rahmen ergeben Probleme mit Vor-Echo-Artefakten und gespensterhaften Tönen.in view of it is advantageous as possible to use long frames, since then the number of frame boundaries will be small. Also, the coding efficiency is typically high and high the required transmission bit rate will typically be minimized. However, long frames result in problems with pre-echo artifacts and ghostly tones.

Werden statt dessen kürzere Rahmen verwendet, solche wie SF1 oder sogar SF0, aufweisend die Zeitdauer jeweils von L/2 und L/4, wird jeder mit dem Gebiet Vertraute erkennen, dass die Kodier-Effizienz verringert sein kann, die Übertragungs-Bit-Rate höher zu sein hat und die Probleme mit Rahmen-Grenzen-Artefakten wachsen werden. Jedoch, kürzere Rahmen leiden weniger unter anderen Wahrnehmungs-Artefakten, solchen wie gespensterhaften Tönen und Vor-Echo. Um den Kodier-Fehler so gut wie möglich zu minimieren, sollte man eine Rahmen-Länge, so kurz wie möglich wählen.If, instead, shorter frames are used, such as SF1 or even SF0, having the time periods of L / 2 and L / 4, respectively, anyone familiar with the art will recognize that the coding efficiency can be reduced, the transmission bit rate is higher and the problems with frame boundary artifacts will grow. However, shorter frames suffer less from other perceptual artifacts, such as ghostly sounds and pre-echo. To minimize the coding error as much as possible, you should choose a frame length as short as possible.

Entsprechend der vorliegenden Erfindung wird die Audio-Wahrnehmung verbessert durch Verwenden einer Rahmen-Länge für das Kodieren des Seiten-Signals, welche abhängig ist von dem gegenwärtig vorhandenen Signal-Inhalt. Da der Einfluss verschiedener Rahmen-Längen auf die Audio-Wahrnehmung verschieden sein wird, abhängig von der Natur der zu kodierenden Töne, kann eine Verbesserung dadurch erreicht werden, dass der Natur des Signals selbst erlaubt wird die verwendete Rahmen-Länge zu beeinflussen. Das Kodieren des Haupt-Signals ist nicht Gegenstand der vorliegenden Erfindung und wird daher nicht im Detail beschrieben. Jedoch können die für das Kodieren des Haupt-Signals verwendeten Rahmen-Längen gleich oder nicht gleich sein zu den für das Kodieren des Seiten-Signals verwendeten Rahmen-Längen.Corresponding In the present invention, the audio perception is improved by using a Frame length for the Encoding the page signal, which depends on the currently available one Signal content. Because the influence of different frame lengths on the audio perception will be different, depending on the nature of the coded Sounds, can An improvement can be achieved by the nature of the signal itself is allowed to influence the frame length used. Coding the Main signal is not the subject of the present invention and is therefore not described in detail. However, those for coding the main signal used frame lengths equal to or not equal to those for encoding the page signal used frame lengths.

Wegen kleiner zeitlicher Veränderungen kann es in einigen Fällen nützlich sein, das Seiten-Signal unter Verwendung relativ langer Rahmen zu kodieren. Dieses kann der Fall sein bei Aufzeichnungen mit einer großen Menge von diffusem Ton-Feld, solchen wie Konzert-Aufzeichnungen. In anderen Fällen, solchen wie Stereo-Sprach-Konversation, sind wahrscheinlich kurze Rahmen zu bevorzugen. Die Entscheidung, welche Rahmen-Länge zu bevorzugen ist kann auf zwei grundlegende Arten getroffen werden.Because of small temporal changes It can in some cases useful be, the side signal using relatively long frame to encode. This can be the case with records with a large amount of diffuse clay field, such as concert records. In other cases, such as stereo-voice conversation, are probably short frames to prefer. The decision, which frame length to prefer is can be met in two basic ways.

Eine Ausführungsform einer Seiten-Signal-Kodier-Einheit 30 entsprechend der vorliegenden Erfindung ist in 3b illustriert, in welcher eine Endlos-Schleifen-Entscheidung verwendet ist. Ein elementarer Kodier-Rahmen der Länge L wird hier verwendet. Eine Anzahl von Kodier-Schemata 81, gekennzeichnet durch eine getrennte Gruppe 80 von Unter-Rahmen 90, werden erzeugt. Jede Gruppe 80 von Unter-Rahmen 90 enthält ein oder mehrere Unter-Rahmen 90 von gleicher oder unterschiedlicher Länge. Die gesamte Länge der Gruppe 80 von Unter-Rahmen 90 ist jedoch immer gleich der elementaren Kodier-Rahmen-Länge L. Mit Bezugnahmen zu 3b ist das oberste Kodier-Schema gekennzeichnet durch eine Gruppe von Unter-Rahmen, welche nur einen Unter-Rahmen der Länge L enthalten. Die nächste Gruppe von Unter-Rahmen enthält zwei Rahmen der Länge L/2. Die dritte Gruppe enthält zwei Rahmen der Länge L/4, gefolgt durch einen L/2-Rahmen.An embodiment of a page signal encoding unit 30 according to the present invention is in 3b illustrated in which an infinite loop decision is used. An elementary coding frame of length L is used here. A number of coding schemes 81 , characterized by a separate group 80 from sub-frame 90 , are generated. Every group 80 from sub-frame 90 contains one or more sub-frames 90 of equal or different length. The entire length of the group 80 from sub-frame 90 is however always equal to the elementary coding frame length L. With references to 3b For example, the uppermost coding scheme is characterized by a group of subframes containing only one subframe of length L. The next group of sub-frames contains two frames of length L / 2. The third group contains two frames of length L / 4, followed by an L / 2 frame.

Das Signal x_side, geliefert an die Seiten-Signal-Kodier-Einheit 30 wird durch alle Kodier-Schemata 81 kodiert. In dem obersten Kodier-Schema wird der ganze elementare Rahmen in einem Stück kodiert. Jedoch, in den anderen Schemata wird das Signal x_side in jedem Unter-Rahmen getrennt von einander kodiert. Das Ergebnis aus jedem Kodier-Schema wird an einen Auswähler 85 geliefert. Ein Wiedergabetreue-Mess-Mittel 83 bestimmt ein Wiedergabetreue-Maß für jedes der kodierten Signale. Das Wiedergabetreue-Maß ist ein objektiver Qualitäts-Wert, bevorzugt ein Signal-zu-Rauschen-Maß oder ein gewichtetes Signal-zu-Rauschen-Verhältnis. Die Wiedergabetreue-Messungen, verbunden mit jedem Kodier-Schema, werden verglichen und das Ergebnis steuert ein Schalt-Mittel 87, um die kodierten Parameter, repräsentierend das Seiten-Signal aus dem Kodier-Schema, welches das beste Wiedergabetreue-Maß ergeben hat, als das Ausgabe-Signal p_side aus der Seiten-Signal-Kodierer-Einheit 30 auszuwählen.The signal x _side , supplied to the side signal coding unit 30 is through all coding schemes 81 coded. In the top encoding scheme, the entire elementary frame is encoded in one piece. However, in the other schemes, the signal x _side in each subframe is coded separately from each other. The result from each coding scheme is sent to a selector 85 delivered. A fidelity measuring means 83 determines a fidelity measure for each of the encoded signals. The fidelity measure is an objective quality value, preferably a signal-to-noise measure or a weighted signal-to-noise ratio. The fidelity measurements associated with each coding scheme are compared and the result controls a switching means 87 to the coded parameters representing the page signal from the coding scheme which has given the best fidelity measure, as the output signal p _side from the page signal encoder unit 30 select.

Bevorzugt werden alle möglichen Kombinationen von Rahmen-Längen geprüft und die Gruppe von Unter-Rahmen, welche die beste objektive Qualität ergibt, z. B. Signal-zu-Rauschen-Verhältnis, wird gewählt.Prefers be all possible Combinations of frame lengths tested and the Group of sub-frames that gives the best objective quality, z. As signal-to-noise ratio is selected.

In der vorliegenden Ausführungsform werden die Längen der verwendeten Unter-Rahmen ausgewählt entsprechend zu:

wobei l_sf die Längen der Unter-Rahmen, l_f die Länge des Kodier-Rahmens und n ein Integer ist. In der vorliegenden Ausführungsform wird n zwischen 0 und 3 gewählt, es wird möglich sein irgendeine Rahmen-Länge zu verwenden, so lange wie die gesamte Länge der Gruppe konstant gehalten wird.In the present embodiment, the lengths of the sub-frames used are selected according to:

where l _{sf is} the lengths of the subframes, l _{f is} the length of the encoding frame, and n is an integer. In the present embodiment, n is selected between 0 and 3, it will be possible to use any frame length as long as the entire length of the group is kept constant.

In 3c ist eine andere Ausführungsform einer Seiten-Signal-Kodierer-Einheit 30 entsprechend der vorliegenden Erfindung illustriert. Hier ist die Entscheidung der Rahmen-Länge eine Endlos-Schleifen-Entscheidung, basierend auf der Statistik des Signals. In anderen Worten, die spektralen Eigenschaften des Seiten-Signals werden verwendet als eine Basis für das Entscheiden, welches Kodier-Schema zu verwenden sein wird. Wie zuvor sind verschiedene Kodier-Schemata, gekennzeichnet durch verschiedene Gruppen von Unter-Rahmen verfügbar. In dieser Ausführungsform ist der Auswähler 85 jedoch vor dem tatsächlichen Kodieren platziert. Das Eingabe-Seiten-Signal x_side tritt in den Auswähler 85 und eine Signal-Analysier-Einheit 84 ein. Das Ergebnis der Analyse wird die Eingabe eines Schalters 86, in welchem nur eines der Kodier-Schemata 81 verwendet wird. Die Ausgabe aus diesem Kodier-Schema wird auch das Ausgabe-Signal p_side aus der Seiten-Signal-Kodier-Einheit 30 sein.In 3c is another embodiment of a page signal encoder unit 30 illustrated in accordance with the present invention. Here, the decision of frame length is an infinite loop decision based on the statistics of the signal. In other words, the spectral properties of the page signal are used as a basis for deciding which coding scheme to use. As before, various coding schemes characterized by different groups of subframes are available. In this embodiment, the selector 85 however, placed before actual coding. The input side signal x _side enters the selector 85 and a signal analyzing unit 84 one. The result of the analysis is the input of a switch 86 in which only one of the coding schemes 81 is used. The output from this coding scheme will also be the output signal p _side of the _page th signal coding unit 30 be.

Der Vorteil mit einer Endlos-Schleifen-Entscheidung ist, dass nur eine Kodierung tatsächlich auszuführen ist. Der Nachteil ist jedoch, dass die Analyse der Signal-Eigenschaften tatsächlich sehr kompliziert sein kann und es schwierig sein kann, mögliches Verhalten vorherzusagen, um fähig zu sein, in dem Schalter 86 eine geeignete Wahl zu treffen. Eine Menge an statistischer Analyse von Ton muss ausgeführt und in der Signal-Analyse-Einheit 84 eingeschlossen sein. Irgendeine kleine Veränderung in den Kodier-Schemata kann das statistische Verhalten auf den Kopf stellen.The advantage with an infinite loop decision is that only one coding is actually to be executed. The disadvantage, however, is that the analysis of the signal characteristics can actually be very complicated and it can be difficult to predict possible behavior to be able to be in the switch 86 to make a suitable choice. A lot of statistical analysis of sound needs to be done and in the signal analysis unit 84 be included. Any little change in the coding schemes can turn statistical behavior upside down.

Durch das Verwenden der Endlos-Schleifen-Auswahl (3b) können Kodier-Schemata ohne irgendeine sonstige Änderung in dem Rest der Einheit ausgetauscht werden. Andererseits, wenn viele Kodier-Schemata zu untersuchen sind, werden die Rechenleistungs-Anforderungen hoch sein.By using the infinite loop selection ( 3b ) coding schemes may be exchanged without any other change in the remainder of the unit. On the other hand, if many coding schemes are to be investigated, the computational power requirements will be high.

Der Nutzen bei solch einem Kodieren variabler Länge für das Seiten-Signal ist, dass zwischen einer feinen zeitlichen Auflösung und grober Frequenz-Auflösung auf der einen Seite und grober zeitlicher Auflösung und feiner Frequenz-Auflösung auf der anderen Seite gewählt werden kann. Die obigen Ausführungsformen werden das Stereo-Bild in der bestmöglichen Weise erhalten.Of the The benefit of such variable length coding for the page signal is that between a fine temporal resolution and coarse frequency resolution one side and gross temporal resolution and fine frequency resolution chosen the other side can be. The above embodiments will be the stereo picture in the best possible Received manner.

Es gibt auch einige Erfordernisse für das tatsächliche in den verschiedenen Kodier-Schemata verwendete Kodieren. Insbesondere, wenn die Endlos-Schleifen-Auswahl verwendet wird, müssen die Rechenleistungs-Ressourcen groß sein, um eine Anzahl von mehr oder weniger gleichzeitigem Kodieren auszuführen. Umso komplizierter der Kodier-Vorgang ist, umso mehr Rechen-Leistung wird benötigt. Außerdem ist eine geringe Bit-Rate bei der Übertragung auch zu bevorzugen.It There are also some requirements for the actual coding used in the various coding schemes. Especially, if the infinite loop selection is used, the Computing power resources be great to perform a number of more or less simultaneous coding. more the more complex the coding process, the more computational power is required. Furthermore a low bit rate is also preferable in the transmission.

Das in US 5,434,948 präsentierte Verfahren verwendet eine gefilterte Version des Mono(Haupt)-Signals, um dem Seiten- oder Differenz-Signal zu gleichen. Die Filter-Parameter werden optimiert und dürfen mit der Zeit variieren. Die Filter-Parameter werden dann übertragen, repräsentierend eine Kodierung des Seiten-Signals. In einer Ausführungsform wird auch ein Seiten-Residuum-Signal übertragen. In vielen Fällen würde ein solches Vorgehen möglich sein, um als das Seiten-Signal-Kodier-Verfahren innerhalb des Geltungsbereichs dieser Erfindung verwendet zu werden. Dieses Vorgehen hat jedoch einige Nachteile. Die Quantelung der Filter-Koeffizienten und irgendein Seiten-Residuum-Signal erfordern oft relativ hohe Bit-Raten für die Übertragung, da die Ordnung des Filters hoch sein muss, um eine genaue Schätzung des Seiten-Signals zu liefern. Die Schätzung des Filters kann selbst problematisch sein, speziell in Fällen von Übergangs-reicher Musik. Schätzungs-Fehler werden ein modifiziertes Seiten-Signal ergeben, welches manchmal größer in Magnitude ist als das unmodifizierte Signal. Dieses wird zu höheren Bit-Raten-Anforderungen führen. Darüber hinaus, wenn eine neue Gruppe von Filter-Koeffizienten nach jeweils N Abtastungen berechnet werden, müssen die Filter-Koeffizienten interpoliert werden, um einen glatten Übergang von einer Gruppe von Filter-Koeffizienten zu einer anderen, wie oben diskutiert, zu ergeben. Interpolation von Filter-Koeffizienten ist eine komplexe Aufgabe und Fehler in der Interpolation werden sich in großen Seiten-Fehler-Signalen manifestieren, führend zu höheren Bit-Raten, benötigt für den Differenz-Fehler-Signal-Kodierer.This in US 5,434,948 The presented method uses a filtered version of the mono (main) signal to equal the page or difference signal. The filter parameters are optimized and may vary over time. The filter parameters are then transmitted representing a coding of the page signal. In one embodiment, a page residual signal is also transmitted. In many cases, such an approach would be possible to be used as the page signal encoding method within the scope of this invention. However, this procedure has some disadvantages. The quantization of the filter coefficients and any side residual signal often require relatively high bit rates for transmission because the order of the filter must be high to provide an accurate estimate of the side signal. The estimation of the filter itself can be problematic, especially in cases of transient-rich music. Estimation errors will result in a modified side signal, which is sometimes greater in magnitude than the unmodified signal. This will lead to higher bit rate requirements. In addition, when calculating a new set of filter coefficients after every N samples, the filter coefficients must be interpolated to give a smooth transition from one set of filter coefficients to another, as discussed above. Interpolation of filter coefficients is a complex task and errors in the interpolation will manifest themselves in large side-error signals, leading to higher bit-rates needed for the difference-error-signal-coder.

Ein Mittel, um die Notwendigkeit für Interpolation zu vermeiden, ist die Filter-Koeffizienten auf einer Abtastung-für-Abtastung-Basis zu aktualisieren und auf rückwärtsadaptive/verwendbare Analyse zu vertrauen. Für diese Arbeit wird es erforderlich sein, dass die Bit-Rate des Residuum-Kodierers ziemlich hoch ist. Dieses ist daher keine gute Alternative für Stereo-Kodierung bei niedriger Bit-Rate.One Means to the need for To avoid interpolation, the filter coefficients are on one Sample-by-sample basis to update and to backward / adaptable Trust analysis. For This work will require that the bit rate of the residual encoder be pretty much is high. This is therefore not a good alternative for stereo coding at low bit rate.

Es existieren Fälle, z. B. recht üblich mit Musik, in welchen das Mono- und die Differenz-Signale nahezu unkorreliert sind. Die Filter-Schätzung wird dann sehr mühevoll mit dem zusätzlichen Risiko, die Dinge für den Differenz-Fehler-Signal-Kodierer nur schlechter zu machen.It there are cases z. B. quite common with music in which the mono and differential signals are almost are uncorrelated. The filter estimation then becomes very painstaking the additional Risk things for the difference error signal encoder just to make it worse.

Die Lösung entsprechend zu US 5,434,948 kann recht gut arbeiten in Fällen, in welchen die Filter-Koeffizienten sich sehr langsam über die Zeit verändern, z. B. bei Telefon-Konferenz-Systemen. Im Fall von Musik-Signalen arbeit dieser Ansatz nicht sehr gut, da die Filter sich sehr schnell ändern müssen, um dem Stereo-Bild zu folgen. Das bedeutet, dass Unter-Rahmen-Längen von sehr verschiedener Größe zu verwenden sind, was bedeutet, dass die Anzahl von zu prüfenden Kombinationen rapide ansteigt. Das bedeutet wiederum, dass die Anforderungen für das Berechnen aller möglichen Kodier-Schemata unpraktikabel hoch werden.The solution according to US 5,434,948 can work quite well in cases where the filter coefficients change very slowly over time, e.g. B. in telephone conference systems. In the case of music signals, this approach does not work very well, since the filters have to change very fast to follow the stereo image. This means that subframe lengths of very different sizes are to be used, which means that the number of combinations to be tested increases rapidly. This in turn means that the requirements for computing all possible coding schemes become impractically high.

Daher basiert in einer bevorzugten Ausführungsform das Kodieren des Seiten-Signals auf der Idee, die Redundanz zwischen dem Mono- und dem Seiten-Signal durch Verwenden eines einfachen Abgleich/Ausgleich-Faktors anstelle eines komplexen Bit-Rate-verbrauchenden Prädiktor-Filters zu reduzieren. Das Residuum dieses Vorgangs wird dann kodiert. Die Größe eines solchen Residuums ist relativ klein und verlangt nicht nach hoher Bit-Rate für die Übertragung. Diese Idee ist tatsächlich sehr geeignet, um sie mit dem früher beschriebenen Ansatz der variablen Rahmen-Gruppe zu kombinieren, da die Berechnungs-Komplexität gering ist.Therefore, in a preferred embodiment, the coding of the side signal is based on the idea of reducing the redundancy between the mono and the side signal by using a simple balance / equalization factor instead of a complex bit rate consuming predictor filter. The Resi duum of this process is then coded. The size of such residual is relatively small and does not require high bit rate for transmission. In fact, this idea is very well suited to combine with the variable frame group approach described earlier, since the computational complexity is low.

Die Verwendung eines Abgleich/Ausgleich-Faktors, kombiniert mit dem Ansatz der variablen Rahmen-Länge beseitigt die Notwendigkeit von komplexer Interpolation und die verbundenen Probleme, welche Interpolation verursachen kann. Darüber hinaus ergibt die Verwendung eines einfachen Abgleich/Ausgleich-Faktors anstelle eines komplexen Filters weniger Probleme mit der Schätzung, da mögliche Schätz-Fehler für den Abgleich/Ausgleich-Faktor weniger Einfluss haben. Die bevorzugte Lösung wird fähig sein beides, verschobene Signale und diffuse Ton-Felder, mit guter Qualität und mit begrenzten Bit-Raten-Anforderungen und Berechnungs-Ressourcen zu reproduzieren.The Using an adjustment / compensation factor combined with the Variable frame length approach eliminates the need for complex interpolation and the related problems, which may cause interpolation. Furthermore results in the use of a simple adjustment / compensation factor instead of a complex filter, there are fewer problems with the estimation because possible estimation errors for the Balance / compensation factor have less influence. The preferred solution will be able both, shifted signals and diffuse sound fields, with good quality and with limited bit rate requirements and computational resources too reproduce.

4 illustriert eine bevorzugte Ausführungsform eines Stereo-Kodierers entsprechend der vorliegenden Erfindung. Diese Ausführungsform ist sehr ähnlich zu der in 2a gezeigten, jedoch mit den Details der Seiten-Signal-Kodier-Einheit 30 dargestellt. Der Kodierer 14 dieser Ausführungsform hat keine Vor-Verarbeitungs-Einheit und die Eingabe-Signale werden direkt an die Additions- Und Subtraktions-Einheiten 34, 36 geliefert. Das Mono-Signal x_mono wird mit einem bestimmten Abgleich/Ausgleich-Faktor g_sm in einem Multiplikator 33 multipliziert. In einer Subtraktions-Einheit 35 wird das multiplizierte Mono-Signal von dem Seiten-Signal x_side subtrahiert, das ist hauptsächlich die Differenz zwischen den zwei Kanälen, um ein Residuum-Signal zu erzeugen. Der Abgleich/Ausgleich-Faktor g_sm wird bestimmt basierend auf dem Inhalt der Mono- und Seiten-Signale durch den Optimierer 37, um das Residuum-Signal entsprechend zu einem Qualitäts-Kriterium zu minimieren. Das Qualitäts-Kriterium ist bevorzugt ein Kriterium der kleinsten Quadrate. Das Seiten-Residuum-Signal wird in einem Seiten-Residuum-Kodierer 39 entsprechen zu irgendeiner Kodier-Prozedur kodiert. Bevorzugt ist der Seiten-Residuum-Kodierer 39 ein Niedrig-Bit-Raten-Transformation-Kodierer oder ein CELP (Codebook Excited Linear Prediction)-Kodierer. Die Kodier-Parameter p_side, repräsentierend das Seiten-Signal enthalten dann die Kodier-Parameter p_{side
residual}, repräsentierend das Seiten-Residuum-Signal und den optimierten Abgleich/Ausgleich-Faktor 49. 4 illustrates a preferred embodiment of a stereo encoder according to the present invention. This embodiment is very similar to that in FIG 2a shown, however, with the details of the side signal coding unit 30 shown. The encoder 14 This embodiment has no preprocessing unit and the input signals are sent directly to the addition and subtraction units 34 . 36 delivered. The mono signal x _mono becomes a multiplier with a certain equalize / equalize factor g _sm 33 multiplied. In a subtraction unit 35 For example, the multiplied mono signal is subtracted from the side signal x _side , which is mainly the difference between the two channels to produce a residual signal. The balance factor g _sm is determined based on the content of the mono and side signals by the optimizer 37 to minimize the residual signal according to a quality criterion. The quality criterion is preferably a least squares criterion. The page residual signal is in a page residual encoder 39 correspond to any coding procedure coded. Preferred is the page residual encoder 39 a low-bit-rate-transform encoder or a codebook excited linear prediction (CELP) encoder. The coding parameters p _side representing the page signal then contain the coding parameters p _{side residual} , representing the side residual signal and the optimized tuning / equalizing factor 49 ,

In der Ausführungsform der 4 ist das Mono-Signal 42, verwendet für das Synthetisieren der Seiten-Signale, das Ziel-Signal x_mono für den Mono-Kodierer 38. Wie oben erwähnt (in Verbindung mit 2a) kann das Lokale-Synthese-Signal des Mono-Kodierers 38 auch verwendet sein. In dem letzteren Fall kann die gesamte Kodierer-Verzögerung vergrößert sein und die Berechnungs-Komplexität für das Seiten-Signal kann anwachsen. Andererseits kann die Qualität besser sein, da es dann möglich ist, in dem Mono-Kodierer gemachte Kodier-Fehler zu reparieren.In the embodiment of the 4 is the mono signal 42 , for synthesizing the page signals, uses the x _mono signal for the mono encoder 38 , As mentioned above (in conjunction with 2a ) can be the local synthesis signal of the mono-coder 38 also be used. In the latter case, the overall encoder delay may be increased and the computational complexity for the page signal may increase. On the other hand, the quality can be better, since it is then possible to repair coding errors made in the mono-coder.

In einer mehr mathematischen Weise kann das grundlegende Kodier-Schema wie folgt beschrieben werden. Bezeichne die beiden Kanäle als a und b, welche der linke und der rechte Kanal eines Stereo-Paars sein können. Die Kanal-Signale werden durch Addition in ein Mono-Signal und durch Subtraktion in ein Seiten-Signal kombiniert. In Gleichungsform werden die Vorgänge beschrieben als: xmono(n) = 0.5(a(n) + b(n)) xside(n) = 0.5(a(n) – b(n)) In a more mathematical manner, the basic coding scheme can be described as follows. Designate the two channels as a and b, which can be the left and right channels of a stereo pair. The channel signals are combined by addition into a mono signal and by subtraction into a side signal. In equation form the operations are described as: x mono (n) = 0.5 (a (n) + b (n)) x side (n) = 0.5 (a (n) - b (n))

Es ist nützlich die x_mono und x_side -Signale um einen Faktor 2 nach unten zu skalieren. Es ist hier angenommen, dass andere Wege des Erzeugens der x_mono und x_side existieren. Man kann zum Beispiel verwenden: xmono(n) = γa(n) + (1 – γ)b(n) xside(n) = γa(n) – (1 – γ)b(n) 0 ≤ γ ≤ 1.0. It is useful to scale the x _mono and x _side signals down by a factor of 2. It is assumed here that other ways of generating x _mono and x _side exist. For example, you can use: x mono (n) = γa (n) + (1-γ) b (n) x side (n) = γa (n) - (1-γ) b (n) 0 ≤ γ ≤ 1.0.

Für Blöcke von Eingabe-Signalen wird ein modifiziertes Residuum-Seiten-Signal berechnet entsprechend zu: xside residual(n) = xside(n) – f(xmono' xside)xmono(n)wobei f(x_mono, x_side) eine Abgleich/Ausgleich-Faktor-Funktion ist, welche auf dem Block von N Abtastungen, das bedeutet einem Unter-Rahmen, des Seiten- und Mono-Signals basiert und welche bestrebt ist so viel wie möglich von dem Seiten-Signal zu entfernen. In anderen Worten, der Abgleich/Ausgleich-Faktor wird verwendet, um das Seiten-Residuum-Signal zu minimieren. In dem speziellen Fall, in welchem es im Sinne kleinster Fehler-Quadrate minimiert ist, ist dieses equivalent zum Minimieren der Energie des Seiten-Residuum-Signals x_{side residual}.For blocks of input signals, a modified residual side signal is calculated according to: x side residual (n) = x side (n) - f (x mono' x side ) x mono (N) where f (x _mono , x _side ) is an equalize / equalize factor function which is on the block of N samples, the means a sub-frame based on the page and mono signal and which strives to remove as much of the page signal as possible. In other words, the balance / equalization factor is used to minimize the side residual signal. In the particular case where it is minimized in terms of least error squares, this is equivalent to minimizing the energy of the side residual signal x _{side residual} .

In dem oben erwähnten speziellen Fall wird f(x_mono, x_side) beschrieben als:

wobei x_side das Seiten-Signal und x_mono das Mono-Signal ist. Bemerke, dass die Funktion basiert auf einem Block, beginnend bei „frame start" (Rahmen-Beginn) und endend bei „frame end" (Rahmen-Ende).In the special case mentioned above, f (x _mono , x _side ) is described as:

where x _{side is} the side signal and x _{mono is} the mono signal. Note that the function is based on a block, starting at "frame start" and ending at "frame end".

Es ist möglich in der Frequenz-Domäne bei der Berechnung des Abgleich/Ausgleich-Faktors Gewichtung hinzuzufügen. Dieses wird gemacht durch Konvolution der x_side- und x_mono-Signale mit der Impuls-Reaktion eines Gewichtungs-Filters. Es ist dann möglich, die Schätzungs-Fehler in einen Frequenzbereich zu schieben, in welchem diese weniger gut zu hören sind. Dieses wird als Wahrnehmungs-Wichtung bezeichnet.It is possible to add weighting in the frequency domain when calculating the adjustment / compensation factor. This is done by convolution of the x _side and x _mono signals with the impulse response of a weighting filter. It is then possible to shift the estimation errors to a frequency range where they are less easy to hear. This is called perceptual weighting.

Eine gequantelte Version des Abgleich/Ausgleich-Faktor-Werts, gegeben durch die Funktion f(x_mono, x_side) wird an den Dekodierer übertragen. Es ist vorzuziehen, die Quantelung bereits in Betracht zu ziehen, wenn das modifizierte Signal erzeugt wird. Der folgende Ausdruck wird dann erzielt: xside residual(n) = xside(n) – gQxmono(n)

A quantized version of the trim / offset factor value given by the function f (x _mono , x _side ) is transmitted to the decoder. It is preferable to already consider the quantization when the modified signal is generated. The following expression is then obtained: x side residual (n) = x side (n) - g Q x mono (N)

Q_g(..) ist eine Quantelungs-Funktion, welche angewandt ist auf den Abgleich/Ausgleich-Faktor, gegeben durch die Funktion f(x_mono, x_side). Der Abgleich/Ausgleich-Faktor wird in dem Übertragungs-Kanal übertragen. In normalen links-rechts liegenden Signalen ist der Abgleich/Ausgleich-Faktor begrenzt auf das Intervall [–1.0 1.0]. Wenn andererseits die Signale außer Phase sind in Bezug zu einander, kann der Abgleich/Ausgleich-Faktor über diese Grenzen hinausgehen.Q _g (..) is a quantization function which is applied to the balance / equalization factor given by the function f (x _mono , x _side ). The balance / equalization factor is transmitted in the transmission channel. In normal left-right signals, the adjustment / compensation factor is limited to the interval [-1.0 1.0]. On the other hand, if the signals are out of phase with each other, the balance / equalization factor may go beyond these limits.

Als ein optionales Mittel, um das Stereo-Bild zu stabilisieren, kann man den Abgleich/Ausgleich-Faktor begrenzen, wenn die normalisierte Quer-Korrelation zwischen dem Mono- und dem Seiten-Signal schlecht ist, wie gegeben durch die nachfolgende Gleichung:

wobeiAs an optional means to stabilize the stereo image, one can limit the balance / equalization factor if the normalized cross-correlation between the mono and the side signal is poor as given by the following equation:

in which

Diese Situationen treten recht häufig ein bei z. B. klassischer Musik oder Studio-Musik mit einem großen Anteil von diffusen Tönen, wobei die a und b Kanäle in manchen Fällen sich gegenseitig fast auslöschen in Fällen, in welchen ein Mono-Signal erzeugt wird. Die Wirkung auf den Abgleich/Ausgleich-Faktor ist, dass dieser schnell springen kann, verursachend ein verwischtes Stereo-Bild. Die obige Korrektur schwächt dieses Problem ab.These situations occur quite often at z. Classical music or studio music with a large proportion of diffused sounds, where the a and b channels in some cases almost cancel each other out in cases where a mono signal is generated. The effect on the balance / equalization factor is that this can jump quickly, creating a blurred stereo image. The above correction weakens this Problem.

Der Filter-basierte Ansatz in US 5,434,948 hat ähnliche Probleme, aber in jenem Fall ist die Lösung nicht so einfach.The filter-based approach in US 5,434,948 has similar problems, but in that case the solution is not so easy.

Wenn E_s die Kodier-Funktion (z. B. ein Transformations-Kodierer) des Seiten-Residuum-Signals und E_m die Kodier-Funktion des Mono-Signals ist, dann können die dekodierten a" und b"-Signale in dem Dekodierer-Ende beschrieben werden als (es ist angenommen hier, dass γ = 0.5): a''(n) = (1 + gQ)x''mono(n) + x''side(n) b''(n) = (1 – gQ)x''mono(n) – x''side(n) x''side = Es –1(Es(xside residual) x''mono = Em –1(Em(xmono)) If E _{s is} the coding function (eg, a transform coder) of the side residual signal and E _{m is} the coding function of the mono signal, then the decoded a "and b" signals in the decoder -End be described as (it is assumed here that γ = 0.5): a '' (n) = (1 + g Q ) X '' mono (n) + x '' side (N) b '' (n) = (1 - g Q ) X '' mono (n) - x '' side (N) x '' side = E s -1 (e s (x side residual ) x '' mono = E m -1 (e m (x mono ))

Ein wichtiger Nutzen aus dem Berechnen des Abgleich/Ausgleich-Faktors für jeden Rahmen ist, dass die Verwendung von Interpolation vermieden wird. Stattdessen wird normalerweise, wie oben beschrieben, die Rahmen-Verarbeitung mit überlappenden Rahmen ausgeführt.One important benefit from calculating the balance / compensation factor for each The framework is that the use of interpolation is avoided. Instead, normally, as described above, the frame processing is overlapping Frame executed.

Das Kodier-Prinzip verwendend Abgleich/Ausgleich-Faktoren arbeitet besonders gut in dem Fall von Musik-Signalen, wo typisch schnelle Wechsel benötigt werden, um dem Stereo-Bild zu folgen.The Using Coding Principle Matching / Compensation Factors works especially good in the case of music signals, where typically fast change needed to follow the stereo picture.

Kürzlich ist Viel-Kanal-Kodierung populär geworden. Ein Beispiel ist 5.1-Kanal Umgebungs-Ton in DVD-Filmen. Die Kanäle werden dann so angeordnet: vorne links, vorne Zentrum, vorne rechts, hinten links, hinten rechts und Sub-Woofer. In 5 ist eine Ausführungsform eines Kodierers dargestellt, welcher die drei Front-Kanäle in einer solchen Anordnung, ausnutzend Zwischen-Kanal-Redundanzen entsprechend der vorliegenden Erfindung, kodiert.Recently, multi-channel coding has become popular. An example is 5.1ch surround sound in DVD movies. The channels are then arranged like: front left, front center, front right, back left, back right and sub woofer. In 5 For example, an embodiment of an encoder is illustrated that encodes the three front channels in such an arrangement utilizing inter-channel redundancies according to the present invention.

Die drei Kanäle L, C, R werden an die drei Eingängen 16A-C geliefert und das Mono-Signal x_mono wird als Summe aus allen drei Kanälen erzeugt. Eine Zentrum-Signal-Kodierer-Einheit 130 ist hinzugefügt, welche das Zentrums-Signal x_centre empfängt. Das Mono-Signal 42 ist in dieser Ausführungsform das kodierte und dekodierte Mono-Signal x''_mono und ist multipliziert mit einem bestimmten Abgleich/Ausgleich-Faktor g_Q in einem Multiplizierer 133. In einer Subtrahier-Einheit 135 wird das multiplizierte Mono-Signal von dem Zentrum-Signal X_centre subtrahiert, um ein Zentrum-Residuum-Signal zu erzeugen. Der Abgleich/Ausgleich-Faktor g_Q wird bestimmt basierend auf dem Inhalt des Mono- und des Zentrum-Signals durch einen Optimierer 137, um das Zentrum-Residuum-Signal entsprechend zu einem Qualitäts-Kriterium zu minimieren. Das Zentrum-Signal wird in einem Zentrum-Residuum-Kodierer 139 entsprechend zu irgendeiner Kodier-Prozedur kodiert. Bevorzugt ist der Zentrum-Residuum-Kodierer 139 ein niedrig-Bit-Raten Transformations-Kodierer oder ein CELP-Kodierer. Die Kodier-Parameter p_centre, repräsentierend das Zentrum-Signal, umfassen dann die Kodier-Parameter p_{centre residual}, repräsentierend das Zentrum-Residuuum-Signal und den optimierten Abgleich/Ausgleich-Faktor 149. Das Zentrum-Residuum-Signal und das skalierte Mono-Signal werden in einer Addier-Einheit 235 addiert, erzeugend ein modifiziertes Zentrum-Signal 142, welches für Kodier-Fehler kompensiert ist.The three channels L, C, R are connected to the three inputs 16A -C and the mono signal x _mono is generated as the sum of all three channels. A center signal encoder unit 130 is added, which receives the center signal x _center . The mono signal 42 In this embodiment, the coded and decoded mono signal x "is _mono and is multiplied by a certain equalize / equalize factor g _Q in a multiplier 133 , In a subtracting unit 135 The multiplied mono signal is subtracted from the center signal X _center to produce a center residual signal. The balance / compensation factor g _Q is determined based on the contents of the mono and center signals by an optimizer 137 to minimize the center residual signal according to a quality criterion. The center signal is in a center-to-field encoder 139 encoded according to any coding procedure. Preferred is the center-to-center encoder 139 a low bit rate transform encoder or a CELP encoder. The coding parameters p _center , representing the center signal, then comprise the coding parameters p _{center residual} , representing the _{center residual} signal and the optimized tuning / equalizing factor 149 , The center residual signal and the scaled mono signal are stored in an adder unit 235 adds generating a modified center signal 142 , which is compensated for coding errors.

Das Seiten-Signal x_side, das ist die Differenz zwischen links L und rechts R-Kanälen wird an die Seiten-Signal-Kodierer-Einheit 30 wie in zuvor behandelten Ausführungsformen geliefert. Jedoch hängt hier der Optimierer 37 auch von dem modifizierten Zentrum-Signal 142, geliefert durch die Zentrum-Signal-Kodierer-Einheit 130, ab. Das Seiten-Residuum-Signal wird daher als eine optimale Linearkombination des Mono-Signals 42, des modifizierten Zentrum-Signals 142 und des Seiten-Signals in der Subtraktions-Einheit 35 erzeugt.The side signal x _side , that is the difference between left L and right R channels, is sent to the side signal coder unit 30 as supplied in previously discussed embodiments. However, here's the optimizer 37 also from the modified center signal 142 supplied by the center signal encoder unit 130 , from. The side residual signal is therefore considered to be an optimal linear combination of the mono signal 42 , the modified center signal 142 and the side signal in the subtraction unit 35 generated.

Das oben beschriebene Konzept variabler Rahmen-Längen kann auf jedem der Seiten- und Zentrum-Signale oder auf beide angewandt werden.The The concept of variable frame lengths described above can be used on any of the and center signals or both.

6 illustriert eine Dekodier-Einheit, brauchbar für das Empfangen kodierter Audio-Signale aus einer Kodier-Einheit der 5. Das empfangene Signal 54 ist unterteilt in Kodier-Parameter p_mono, repräsentierend das Haupt-Signal, Kodier-Parameter p_centre, repräsentierend das Zentrum-Signal und Kodier-Parameter p_side, repräsentierend das Seiten-Signal. In dem Dekodierer 64 werden die Kodier-Parameter p_mono, repräsentierend das Haupt-Signal, verwendet, um ein Haupt-Signal x''_mono zu erzeugen. In dem Dekodierer 160 werden die Kodier-Parameter p_centre, repräsentierend das Zentrum-Signal, verwendet, um ein Zentrum-Signal x''_centre zu erzeugen, basierend auf dem Haupt-Signal x''_mono. In dem Dekodierer 60 werden die Kodier-Parameter p_side, repräsentierend das Seiten-Signal, dekodiert, erzeugend ein Seiten-Signal x''_side, basierend auf dem Haupt-Signal x''_mono und dem Zentrum-Signal x''_centre. Die Prozedur kann mathematisch wie folgt ausgedrückt werden:
Die Eingabe-Signale x_left, x_right und x_centre werden in einen Mono-Kanal kombiniert entsprechend zu: xmono(n) = αcxleft(n) + βxright(n) + χxcentre(n),α, β und χ sind zwecks Einfachheit in dem verbleibenden Abschnitt auf 1.0 gesetzt, aber sie können auf beliebige Werte gesetzt werden. Die α, β und χ-Werte können entweder konstant sein oder abhängig von den Signal-Inhalten, um den einen oder anderen Kanal hervorzuheben um optimale Qualität zu erzielen. 6 illustrates a decoding unit useful for receiving coded audio signals from a coding unit of the present invention 5 , The received signal 54 is divided into encode parameter p _mono representing the main signal, encode parameter p _center representing the center signal and encode parameter p _side representing the page signal. In the decoder 64 For example, the coding parameters p _mono representing the main signal are used to _mono generate a main signal x ". In the decoder 160 become the Ko the parameter p _center representing the center signal used to generate a center signal x " _center based on the main signal x" _mono . In the decoder 60 the coding parameters p _side representing the page signal are decoded generating a page signal x " _side , based on the main signal x" _mono and the center signal x " _center . The procedure can be expressed mathematically as follows:
The input signals x _left , x _right and x _center are combined into a mono channel corresponding to: x mono (n) = αcx left (n) + βx right (n) + χx center (N) α, β and χ are set to 1.0 in the remaining section for simplicity, but they can be set to any values. The α, β and χ values can either be constant or dependent on the signal content to highlight one or the other channel for optimum quality.

Die normalisierte Quer-Korrelation zwischen dem Mono- und dem Zentrum-Signal wird berechnet als:

wobeiThe normalized cross-correlation between the mono and center signals is calculated as:

in which

x_centre das Zentrum-Signal und x_mono das Mono-Signal ist. Das Mono-Signal kommt aus dem Mono-Ziel-Signal, aber es ist möglich ebenso gut die lokale Synthese des Mono-Kodierers zu verwenden.x _{center is} the center signal and x _{mono is} the mono signal. The mono signal comes from the mono-target signal, but it is equally possible to use the local synthesis of the mono-coder.

Das zu kodierende Zentrum-Residuum-Signal ist: xcentre residual(n) = xcentre(n) – gQxmono(n)

Q_g(..) ist eine Quantelung-Funktion, welche auf den Abgleich/Ausgleich-Faktor angewandt ist. Der Abgleich/Ausgleich-Faktor wird über den Übertragungs-Kanal übertragen.The center residual signal to be encoded is: x center residual (n) = x center (n) - g Q x mono (N)

Q _g (..) is a quantization function applied to the balance / equalization factor. The adjustment / compensation factor is transmitted via the transmission channel.

Wenn E_c die Kodier-Funktion (z. B. ein Transformations-Kodierer) des Zentrum-Residuum-Signals und E_m die Kodier-Funktion des Mono-Signals ist, dann kann das dekodierte x_centre-Signal an dem Ende des Dekodierers beschrieben werden als: x''centre(n) = gQx''mono(n) + x''centre residual(n) x''centre residual = Ec –1(Ec(xcentre residual)) x''mono = Em –1(Em(xmono)). If E _{c is} the coding function (eg, a transform coder) of the center residual signal and E _{m is} the coding function of the mono signal, then the decoded x _center signal at the end of the decoder may be described are as: x '' center (n) = g Q x '' mono (n) + x '' center residual (N) x '' center residual = E c -1 (e c (x center residual )) x '' mono = E m -1 (e m (x mono )).

Das zu kodierende Seiten-Residuum-Signal ist: xside residual(n) = (xleft(n) – xright(n)) – gQsmx''mono(n) – gQscx''centre(n)wobei g_Qsm und g_Qsc gequantelte Werte der Parameter g_sm und g_sc sind, welche diesen Ausdruck minimieren:

η kann zum Beispiel gleich 2 sein für eine Fehler-Minimierung der kleinsten Fehler-Quadrate. Die g_sm und g_sc-Parameter können gemeinsam oder getrennt gequantelt sein.The page residual signal to be encoded is: x side residual (n) = (x left (n) - x right (n)) - g Qsm x '' mono (n) - g qsc x '' center (N) where g _Qsm and g _{Qsc are} quantized values of the parameters g _sm and g _sc which minimize this expression:

For example, η may equal 2 for an error minimization of the smallest error squares. The g _sm and g _sc parameters can be shared or separated.

Wenn E_s die Kodier-Funktion des Seiten-Residuum-Signals ist, dann sind die dekodierten x''_left und x''_right-Kanal-Signale gegeben als: x''left(n) = x''mono(n) – x''centre(n) + x''side(n) x''right(n) = x''mono(n) – x''centre(n) + x''side(n) x''side(n) = x''side residual + gQsmx''mono(n) + gQscx''centre(n) x''side residual = Es –1(Es(xside residual)). If E _{s is} the encoding function of the side residual signal, then the decoded x '' _left and x '' _right channel signals are given as: x '' left (n) = x '' mono (n) - x '' center (n) + x '' side (N) x '' right (n) = x '' mono (n) - x '' center (n) + x '' side (N) x '' side (n) = x '' side residual + g Qsm x '' mono (n) + g qsc x '' center (N) x '' side residual = E s -1 (e s (x side residual )).

Einer der Wahrnehmungs-Artefakte, welche am meisten störend sind, ist der Vor-Echo-Effekt. In den 7a-b illustrieren Diagramme einen solchen Artefakt. Nehme eine Signal-Komponente an, aufweisend die zeitliche Entwicklung wie durch die Kurve 100 dargestellt. Am Anfang, beginnend bei t0, ist die Signal-Komponente in der Audio-Abtastung nicht vorhanden. Zu einer Zeit t zwischen t1 und t2 erscheint die Signal-Komponente plötzlich. Wenn die Signal-Komponente kodiert wird, verwendend eine Rahmenlänge von t2–t1, wird das Auftreten der Signal-Komponente „verschmiert" sein über den gesamten Rahmen, wie in Kurve 101 angezeigt. Wenn eine Dekodierung der Kurve 101 stattfindet, erscheint die Signal-Komponente zu einer Zeit Δt vor dem beabsichtigten Erscheinen der Signal-Komponente und ein „Vor-Echo" wird wahrgenommen.One of the most disturbing perceptual artifacts is the pre-echo effect. In the 7a -b diagrams illustrate such an artifact. Suppose a signal component having the temporal evolution as through the curve 100 shown. At the beginning, starting with t0, the signal component is not present in the audio sample. At a time t between t1 and t2, the signal component suddenly appears. If the signal component is coded using a frame length of t2-t1, the occurrence of the signal component will be "smeared" over the entire frame, as in curve 101 displayed. If a decoding of the curve 101 takes place, the signal component appears at a time Δt before the intended appearance of the signal component, and a "pre-echo" is detected.

Die Vor-Echo-Artefakte werden deutlicher, wenn lange Kodier-Rahmen verwendet werden. Durch Verwendung kürzerer Rahmen wird der Artefakt etwas unterdrückt. Ein anderer Weg, um oben beschriebene Vor-Echo-Probleme zu behandeln, ist die Tatsache zu nutzen, dass das Mono-Signal verfügbar ist an beiden, dem Kodierer- und dem Dekodierer-Ende. Dieses macht es möglich, das Seiten-Signal zu skalieren, entsprechend der Energie-Kontur des Mono-Signals. An dem Dekodierer-Ende wird das inverse Skalieren ausgeführt und so können einige der Vor-Echo-Probleme erleichtert werden.The Pre-echo artifacts become more apparent when using long encoding frames become. By using shorter ones Frame, the artifact is somewhat suppressed. Another way to go up to treat pre-echo problems described is the fact too that the mono signal is available on both the encoder and and the decoder end. This makes it possible to adjust the page signal scale, according to the energy contour of the mono signal. At the decoder end inverse scaling is done and so can some the pre-echo problems be relieved.

Eine Energie-Kontur des Mono-Signals wird über den gesamten Rahmen berechnet als:

wobei w(n) eine Fenster-Funktion ist. Die einfachste Fenster-Funktion ist eine Rechtecks-Funktion, es können aber andere Fenster-Typen, solche wie ein Hamming-Fenster, bevorzugter sein.An energy contour of the mono signal is calculated over the entire frame as:

where w (n) is a window function. The simplest window function is a rectangle function, but other types of windows, such as a Hamming window, may be more preferable.

Das Seiten-Residuum-Signal ist dann skaliert als:

The page residual signal is then scaled as:

In einer allgemeineren Form kann die obige Gleichung geschrieben werden als:

wobei f(..) eine monotone kontinuierliche Funktion ist. In dem Dekodierer wird die Energie-Kontur für das dekodierte Mono-Signal berechnet und auf das dekodierte Signal angewandt als: x''side(n) = x''side(n)f(Ec(n)), frame start ≤ n ≤ frame end. In a more general form, the above equation can be written as:

where f (..) is a monotonic continuous function. In the decoder, the energy contour for the decoded mono signal is calculated and applied to the decoded signal as: x '' side (n) = x '' side (N) f (E c (n)), frame start ≤ n ≤ frame end.

Da dieses Energie-Kontur-Skalieren in mancher Weise alternativ zu der Verwendung der kürzeren Rahmen-Längen ist, ist dieses Konzept besonders gut geeignet, um kombiniert zu werden mit dem weiter oben beschriebenen Konzept der variablen Rahmen-Längen. Dadurch, dass einige Kodier-Schemata, welche Energie-Kontur-Skalieren anwenden, einige, welche dies nicht tun, und einige, welche Energie-Kontur-Skalieren nur während bestimmter Unter-Rahmen anwenden, verfügbar sind, kann eine flexiblere Gruppe von Kodier-Schemata bereitgestellt werden. In 8 ist eine Ausführungsform einer Signal-Kodierer-Einheit 30 entsprechend der vorliegenden Erfindung illustriert. Hier umfassen die verschiedenen Kodier-Schemata 81 gestrichelte Unter-Rahmen 91, repräsentierend Kodierung anwendend Kontur-Skalieren, und nicht gestrichelte Unter-Rahmen 92, repräsentierend Kodier-Prozeduren Kontur-Skalieren nicht anwendend. Auf diese Weise sind Kombinationen nicht nur von Unter-Rahmen verschiedener Länge, sondern auch von Unter-Rahmen mit verschiedenen Kodier-Prinzipien verfügbar. In dem vorliegenden erläuternden Beispiel unterscheidet sich die Anwendung von Energie-Kontur-Skalierung für verschiedene Kodier-Schemata. In einem allgemeineren Fall können irgendwelche Kodier-Prinzipien in analoger Weise mit dem Konzept der variablen Längen kombiniert werden.Since this energy contour scaling is in some ways alternative to the use of the shorter frame lengths, this concept is particularly well suited to be combined with the concept of variable frame lengths described above. By having some coding schemes that apply energy contour scaling, some that do not, and some that apply energy contour scaling only during certain sub-frames available, a more flexible set of coding may be available. Schemas are provided. In 8th is an embodiment of a signal encoder unit 30 illustrated in accordance with the present invention. Here are the different coding schemes 81 dashed sub-frame 91 representing coding applying contour scaling, and not dashed Un ter-frame 92 , representing coding procedures not applying contour scaling. In this way, combinations are available not only from subframes of different lengths, but also from subframes with different coding principles. In the present illustrative example, the application of energy contour scaling differs for different coding schemes. In a more general case, any coding principles may be analogously combined with the concept of variable lengths.

Die Gruppe von Kodier-Schemata der 8 umfasst Schemata, welche z. B. Vor-Echo-Artefakte auf verschiedene Weise handhaben. In einigen Schemata werden längere Unter-Rahmen mit Vor-Echo-Minimierung entsprechend dem Energie-Kontur-Prinzip verwendet. In anderen Schemata werden kürzere Unter-Rahmen ohne Energie-Kontur-Skalierung verwendet. Abhängig von dem Signal-Inhalt kann eine der Alternativen vorteilhafter sein. Für Fälle sehr massiven Vor-Echos können Kodier-Schemata, verwendend kurze Unter-Rahmen mit Energie-Kontur-Skalierung erforderlich sein.The group of coding schemes of 8th includes schemes which z. B. handle pre-echo artifacts in various ways. In some schemes, longer sub-frames are used with pre-echo minimization according to the energy contour principle. Other schemes use shorter subframes without energy contour scaling. Depending on the signal content, one of the alternatives may be more advantageous. For cases of very massive pre-echoes, coding schemes using short sub-frames with energy contour scaling may be needed.

Die vorgeschlagene Lösung kann in dem gesamten Frequenzband oder in einem oder mehreren bestimmten Sub-Bändern verwendet werden. Die Verwendung von Sub-Bändern kann angewandt werden entweder auf beide, Haupt- und Seiten-Signale oder getrennt auf eines von diesen. Eine bevorzugte Ausführungsform umfasst eine Aufspaltung des Seiten-Signals in einige Frequenz-Bänder. der Grund ist einfach, dass es leichter ist, die mögliche Redundanz in einem isolierten Frequenz-Band zu entfernen als in dem gesamten Frequenz-Band. Dieses ist insbesondere wichtig, wenn Musik-Signale mit reichem spektralem Inhalt kodiert werden.The suggested solution may be in the entire frequency band or in one or more specific ones Sub-bands be used. The use of sub-bands can be used either on both main and side signals or separately on one of these. A preferred embodiment comprises a splitting of the side signal in some frequency bands. the reason is simple, that it is easier, the possible redundancy to remove in an isolated frequency band than in the whole Frequency band. This is especially important if music signals be encoded with rich spectral content.

Eine mögliche Anwendung ist, das Frequenz-Band unterhalb eines vorbestimmten Schwellwerts mit dem obigen Verfahren zu kodieren. der vorbestimmte Schwellwert kann bevorzugt bei 2 kHz oder noch besser bei 1 kHz liegen. Für den verbleibenden Teil des Frequenz-Bereichs von Interesse kann ein anderes zusätzliches Frequenz-Band mit dem obigen Verfahren kodiert werden oder es kann ein völlig anderes Verfahren verwendet werden.A possible Application is, the frequency band below a predetermined threshold encode with the above method. the predetermined threshold may preferably be at 2 kHz or even better at 1 kHz. For the remaining Part of the frequency range of interest may be another additional one Frequency band can be encoded with the above method or it can a completely other method can be used.

Es ist eine Motivation für das Verwenden des obigen Verfahrens bevorzugt für niedrige Frequenzen, dass die diffusen Ton-Felder generell wenig Energie-Inhalt bei hohen Frequenzen haben. Der natürliche Grund ist, dass Ton-Absorption typisch mit der Frequenz anwächst. Auch scheinen die diffusen Ton-Feld-Komponenten bei hohen Frequenzen eine weniger wichtige Rolle für das menschliche Gehör-System zu spielen. Daher ist es nützlich, diese Lösung bei niedrigen Frequenzen (unter 1 oder 2 kHz) einzusetzen und bei höheren Frequenzen auf andere, sogar effizientere Kodier-Schemata zu vertrauen. Die Tatsache, dass das Schema nur bei niedrigen Frequenzen angewandt wird, ergibt eine große Einsparung an Bit-Rate, da die notwendige Bit-Rate bei dem vorgeschlagenen Verfahren proportional ist zu der erforderlichen Bandbreite. In den meisten Fällen kann der Mono-Kodierer das gesamte Frequenz-Band kodieren, während das vorgeschlagene Kodieren des Seiten-Signals vorgeschlagen ist, nur in dem unteren Teil des Frequenz-Bands ausgeführt zu werden, wie durch 9 illustriert. Die Bezugsnummer 301 bezieht sich auf ein Kodier-Schema für das Seiten-Signal entsprechend der vorliegenden Erfindung. Bezugsnummer 302 bezieht sich auf irgendein anderes Kodier-Schema des Seiten-Signals und Bezugsnummer 303 bezieht sich auf ein Kodier-Schema des Seiten-Signals.It is a motivation for using the above method, preferred for low frequencies, that the diffuse tone fields generally have little energy content at high frequencies. The natural reason is that sound absorption typically increases with frequency. Also, the diffuse sound-field components at high frequencies seem to play a less important role in the human auditory system. Therefore, it is useful to use this solution at low frequencies (below 1 or 2 kHz) and rely on other, even more efficient coding schemes at higher frequencies. The fact that the scheme is applied only at low frequencies gives a great bit rate saving since the required bit rate in the proposed method is proportional to the required bandwidth. In most cases, the mono-coder can encode the entire frequency band, while the proposed coding of the page signal is suggested to be performed only in the lower part of the frequency band, as by 9 illustrated. The reference number 301 refers to a coding scheme for the page signal according to the present invention. reference number 302 refers to any other coding scheme of the page signal and reference number 303 refers to a coding scheme of the page signal.

Es besteht auch die Möglichkeit, das vorgeschlagene Verfahren für einige bestimmte Frequenz-Bänder zu verwenden.It there is also the possibility the proposed procedure for some specific frequency bands to use.

In 10 sind die Haupt-Schritte einer Ausführungsform eines Kodier-Verfahrens entsprechend der vorliegenden Erfindung als Fluss-Diagramm illustriert. Die Prozedur beginnt im Schritt 200. Im Schritt 210 wird ein von den polyphonen Signalen abgeleitetes Haupt-Signal kodiert. Im Schritt 212 werden Kodier-Schemata bereitgestellt, welche Unter-Rahmen mit verschiedenen Längen und/oder Reihenfolge umfassen. Ein im Schritt 214 aus den polyphonen Seiten-Signalen abgeleitetes Seiten-Signal wird kodiert durch ein Kodier-Schema, ausgewählt abhängig zumindest teilweise von dem tatsächlichen Signal-Inhalt der polyphonen Signale. Die Prozedur endet im Schritt 299.In 10 The main steps of one embodiment of a coding method according to the present invention are illustrated as a flow chart. The procedure begins in step 200 , In step 210 a main signal derived from the polyphonic signals is coded. In step 212 Coding schemes are provided which include sub-frames of different lengths and / or order. One in the step 214 Side signal derived from the polyphonic side signals is encoded by a coding scheme selected at least in part depending on the actual signal content of the polyphone signals. The procedure ends in step 299 ,

In 11 sind die Haupt-Schritte einer Ausführungsform eines Dekodier-Verfahrens entsprechend der vorliegenden Erfindung als ein Fluss-Diagramm illustriert. Die Prozedur beginnt im Schritt 200. Im Schritt 220 wird ein empfangenes kodiertes Haupt-Signal dekodiert. Im Schritt 222 werden Kodier-Schemata bereitgestellt, welche Unter-Rahmen mit unterschiedlichen Längen und/oder Reihenfolge umfassen. Ein empfangenes Seiten-Signal wird im Schritt 224 dekodiert durch ein ausgewähltes Kodier-Schema. Im Schritt 226 werden die dekodierten Haupt- und Seiten-Signale zu einem polyphonen Signal kombiniert. Die Prozedur endet im Schritt 299.In 11 For example, the main steps of one embodiment of a decoding method according to the present invention are illustrated as a flow chart. The procedure begins in step 200 , In step 220 a received coded main signal is decoded. In step 222 Coding schemes are provided which include sub-frames of different lengths and / or order. A received page signal is in step 224 decoded by a selected coding scheme. In step 226 The decoded main and side signals are combined into a polyphonic signal. The procedure ends in step 299 ,

Die oben beschriebenen Ausführungsformen sind zu verstehen als einige wenige illustrative Beispiele der vorliegenden Erfindung. Es wird durch mit dem Gebiet Vertrauten verstanden werden, dass verschiedene Modifikationen, Kombinationen und Veränderungen an den Ausführungsformen gemacht werden können, ohne von dem Geltungsbereich der vorliegenden Erfindung abzuweichen. Insbesondere können verschiedene Teil-Lösungen in den verschiedenen Ausführungsformen in anderen Konfigurationen kombiniert werde, wo technisch möglich. Der Geltungsbereich der vorliegenden Erfindung ist jedoch definiert durch die angehängten Ansprüche.The Embodiments described above are to be understood as a few illustrative examples of the present Invention. It will be understood by those familiar with the field, that different modifications, combinations and changes on the embodiments can be done without to deviate from the scope of the present invention. In particular, you can different part solutions in the various embodiments combined in other configurations where technically possible. Of the Scope of the present invention is defined, however by the appended claims.

REFERENZENREFERENCES

European Patent 0497413
US patent 5,285,498
US patent 5,434,948
"Binaural cue coding to stereo and multi-channel audio compression ", 112th AES convention, May 2002, Munich, Germany by C. Faller et al.

Claims

A method of encoding multi-channel audio signals comprising the steps of: generating ( 210 ) of a first output signal (p _mono ), which are coding parameters representing a main signal (x _mono ), the main signal (x _mono ) being a first linear combination of signals from at least a first and a second channel (a, b; L, R); and generating ( 214 ) Of a second output signal (p _side), which are a side signal (x _side) representing encoding parameters, wherein the side signal (x _side) being a second linear combination of signals of at least a first channel and a second Channel (a, b; L, R) within a coding frame ( 80 ), characterized by the further step of: providing ( 212 ) of at least two coding schemes ( 81 ), wherein each of the at least two coding schemes is characterized by an associated group of sub-frames ( 90 ), where each group of subframes encodes the coding frame ( 80 ), the sub-frames ( 90 ) of the subframe groups have different lengths; the sum of the lengths of subframes ( 90 ) in each coding scheme ( 81 ) is equal to the length of the coding frame ( 80 ); each group of subframes ( 90 ) at least one subframe ( 90 ); wherein the step of generating ( 214 ) of the second output signal (p _side ), the step of selecting a coding scheme ( 81 ), at least in part dependent on a present signal content of the page signal (x _side ); the second output signal (p _side ) in each of the subframes ( 90 ) of the selected group of subframes ( 90 ) is coded separately.

A method according to claim 1, characterized in that the step of generating ( 214 ) of the second output signal (p _side ), in turn, comprises the steps of: generating coding parameters representing the side signal (x _side ) separately within all subframes ( 90 ) of each of the at least two groups of subframes ( 90 ); Calculating a fidelity measure for each of the at least two coding schemes ( 81 ); and selecting the coded signal from the coding scheme ( 81 ) having the best fidelity measure, as the side parameter representing coding parameter (p _side ).

A method according to claim 2, characterized that the fidelity mail is based on a signal-to-noise measure.

A method according to any one of claims 1 to 3, characterized in that the sub-frames ( 90 ) Have lengths l _sf , corresponding to

where l _{f is} the length of the coding frame ( 80 ) and n is an integer.

A method according to claim 4, characterized that n is less than a predetermined value.

A method according to claim 5, characterized in that at least two coding schemes ( 81 ) comprise all permutations of subframe lengths.

A method according to any one of claims 1 to 6, characterized in that the steps of generating ( 210 ) of the first output signal (p _mono ), in turn, comprise the steps of: generating the main signal (x _mono ); and coding the main signal (x _mono ) into the main signal representing coding parameters (p _mono ); the steps of creating ( 214 ) Of the second output signal in turn comprising the steps of: creating a side residual signal (x _{side residual)} as a difference between the side signal (x _side) and the main signal (x _mono) scaled by a balance / Balancing factor (g _sm ), wherein the balancing / balancing factor (g _sm ) is set as a factor minimizing the side residual signal in accordance with a quality criterion; and encoding the side residual signal and the balance / compensation factor (g _sm ) into the side signal representative coding parameter (p _side ).

A method according to claim 7, characterized that the quality criterion on a measure of the smallest averaged squares is.

A method according to any one of claims 1 to 8, characterized in that the step of encoding the side signal further comprises the step of: scaling the side signal (x _side ) into an energy contour of the main signal (x _mono ).

A method according to claim 9, characterized in that the scaling of the side signal (x _side ) is a division by a factor which is a monotonous continuous function of the energy contour of the main signal (x _mono ).

A method according to claim 10, characterized that the monotone continuous function has a square root function is.

A method according to claim 10 or 11, characterized in that the energy contour, E _c , of the main signal, x _mono , is calculated via a sub-frame, corresponding to:

where L is an arbitrary factor, n is a summation index, m is the sample within the sub-frame, and w (n) is a window function.

A method according to claim 12, characterized the window function is a rectangular window function.

A method according to claim 12, characterized that the window function is a Hamming window function.

A method according to any one of claims 1 to 14, characterized in that at least two coding schemes ( 81 ) comprise different coding principles of the side signal (x _side ).

A method according to claim 15, characterized in that at least one first coding scheme of the at least two coding schemes ( 81 ) a first coding principle for the side signal (x _side ) for all sub-frames ( 90 ) and at least one second coding scheme of the at least two coding schemes ( 81 ) a second coding principle for the side signal (x _side ) for all sub-frames ( 90 ).

A method according to claim 15 or 16, characterized in that at least one coding scheme of the at least two coding schemes ( 81 ) comprises the first encoding principle for the side signal (x _side ) for a subframe and the second encoding principle for the side signal (x _side ) for another subframe.

A method according to claim 1, characterized in that the step of generating ( 214 ) of the second output signal (p _side ) in turn comprises these steps: analyzing the spectral characteristic of the side signal (x _side ); Select a group of subframes ( 90 ), based on the analyzed spectral characteristic; Encoding the side signal (x _side ) separately within all sub-frames ( 90 ) of the selected group of subframes ( 90 ).

A method according to any one of claims 1 to 18, characterized in that the step of generating ( 214 ) of a second output signal (p _side ) in a limited frequency band.

A method according to claim 19, characterized in that the step of generating ( 214 ) of a second output signal (p _side ) is only applied for frequencies below 2 kHz.

A method according to claim 20, characterized in that the step of generating ( 214 ) of a second output signal (p _side ) is applied only for frequencies below 1 kHz.

A method according to any one of claims 1 to 21, characterized in that the multi-channel audio signals are music signals represent.

A method of decoding multi-channel audio signals, comprising the steps of: decoding ( 220 ) of coding parameters (p _mono ) representing a main signal (x _mono ) into a decoded main signal (x '' _mono ); wherein the main signal (x _mono ) is a first linear combination of signals from at least a first and a second channel (a, b; L, R); Decode ( 224 ) encoding parameters (p _side ) representing a decoded side signal (x _side ) into a decoded side signal (x '' _side ); wherein the side signal (x _side ) _comprises a second linear combination of signals from at least a first and a second channel (a, b, L, R) within a sub-frame ( 80 ); and Combine ( 226 ) of at least the main decoded signal (x " _mono ) and the decoded side signal (x" _side ) into signals from at least the first and second channels (a, b; L, R) characterized by this step : Provide ( 222 ) of at least two coding schemes ( 81 ), each of the at least two coding schemes ( 81 ) characterized by an associated group of subframes ( 90 ), where each group of subframes encodes the coding frame ( 80 ) forms; sub-frame ( 90 ) of the groups of subframes have different lengths; the sum of the lengths of subframes ( 90 ) in each coding scheme ( 81 ) is equal to the length of the coding frame ( 80 ); each group of subframes ( 90 ) at least one subframe ( 90 ); and wherein the step of decoding ( 224 ) the encoding parameter (p _side ) representing the side signal again comprises the step of decoding the coding parameters (p _side ) which separate the page signal into the subframe (p _side ). 90 ) of one of the at least two coding schemes ( 81 ).

A coding device ( 14 ), comprising: input means ( 16 ; 16A -C) for multi-channel audio signals (a, b; L, R, C) comprising at least a first and a second channel (a, b, L, R); Medium ( 38 ) for generating a first output signal (p _mono ), which are coding parameters representing a main signal (x _mono ), the main signal (x _mono ) being a first linear combination of signals from at least the first and the second Channel (a, b; L, R); Medium ( 30 ) (For generating a second output signal p _side), which are a side signal (x _side) representing encoding parameters, wherein the side signal (x _side) being a second linear combination of signals of at least the first and second Channel (a, b; L, R) within a coding frame ( 80 ); and output means ( 52 ); characterized by means for providing at least two coding schemes ( 81 ), each of the at least two coding schemes ( 81 ) characterized by an associated group of subframes ( 90 ), where each group of subframes encodes the coding frame ( 80 ), sub-frames ( 90 ) of the groups of subframes have different lengths; the sum of the lengths of subframes ( 90 ) in each coding scheme ( 81 ) is equal to the length of the coding frame ( 80 ); each group of subframes ( 90 ) at least one subframe ( 90 ); where the means ( 30 ) for generating the second output signal (p _side ) again means ( 86 ; 87 ) for selecting a coding scheme which depends, at least in part, on a current signal content of the page signal (x _side ); Means for coding the side signal (x _side ) separated in each of the subframes ( 90 ) of the selected coding scheme.

The decoding device ( 24 ), comprising: input means ( 54 ) for coding parameters (p _mono ) representing a main signal, and coding parameters (p _side ) representing a side signal, the main signal (x _mono ) comprising a first linear combination of a first and a second channel (p _mono ) a, b; L, R); the side signal (x _side ) is a second linear combination of a first and a second channel (a, b, L, R); Medium ( 64 ) for decoding the coding signal (p _mono ) representing the main signal into a decoded main signal (x '' _mono ); Medium ( 60 ) for decoding the page signal within a coding frame ( 80 ) encoding parameter (p _side ) into a decoded side signal (x '' _side ); Medium ( 68 . 70 ) for combining at least the main decoded signal (x " _mono ) and the decoded side signal (x" _side ) into signals from at least a first and a second channel (a, b; L, R); and output means ( 26 ; 26A -C), characterized in that the means ( 60 ) for decoding the encoding parameter (p _side ) representing the side signal, in turn comprises means for providing at least two coding schemes ( 81 ), each of the at least two coding schemes ( 81 ) characterized by an associated group of subframes ( 90 ), where each group of subframes encodes the coding frame ( 80 ), sub-frames ( 90 ) of the groups of subframes have different lengths; the sum of the lengths of subframes ( 90 ) in each coding scheme is equal to the length of the coding frame ( 80 ); each group of subframes ( 90 ) at least one subframe ( 90 ); and the means for decoding the encoding parameter (p _side ) representing the page signal is arranged for decoding the encoding parameters (p _side ) which separate the page signal into the subframe (p _side ). 90 ) of one of the at least two coding schemes ( 81 ).

An audio system ( 1 ) comprising at least one of them: a coding device ( 14 ) according to claim 24, and a decoding device ( 24 ) according to claim 25.