SE527713C2 - Coding of polyphonic signals with conditional filters - Google Patents

Coding of polyphonic signals with conditional filters

Info

Publication number
SE527713C2
SE527713C2 SE0400415A SE0400415A SE527713C2 SE 527713 C2 SE527713 C2 SE 527713C2 SE 0400415 A SE0400415 A SE 0400415A SE 0400415 A SE0400415 A SE 0400415A SE 527713 C2 SE527713 C2 SE 527713C2
Authority
SE
Sweden
Prior art keywords
filter
signal
channel
signals
parameters
Prior art date
Application number
SE0400415A
Other languages
Swedish (sv)
Other versions
SE0400415L (en
SE0400415D0 (en
Inventor
Anisse Taleb
Stefan Bruhn
Ingemar Johansson
Patrik Sandgren
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303499A external-priority patent/SE0303499D0/en
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE0400415A priority Critical patent/SE527713C2/en
Publication of SE0400415D0 publication Critical patent/SE0400415D0/en
Priority to PT48090807T priority patent/PT1639580E/en
Priority to EP04809080.7A priority patent/EP1639580B1/en
Priority to PCT/SE2004/001907 priority patent/WO2005059901A1/en
Priority to ES04809080.7T priority patent/ES2439693T3/en
Priority to DK04809080.7T priority patent/DK1639580T3/en
Priority to JP2006518597A priority patent/JP4323520B2/en
Priority to US11/011,764 priority patent/US7725324B2/en
Priority to EP12154099A priority patent/EP2456236A1/en
Priority to PL04809080T priority patent/PL1639580T3/en
Publication of SE0400415L publication Critical patent/SE0400415L/en
Publication of SE527713C2 publication Critical patent/SE527713C2/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Abstract

Signals of different channels (c 1 -c N ) are combined into one mono signal (x). A set of adaptive filters, preferably one for each channel (c 1 -c N ), is derived in a respective filter adaptation unit (30:1-30:N). When an adaptive filter is applied to the mono signal (x) it reconstructs the signal of the respective channel (c 1 -c N ) under a perceptual constraint. The perceptual constraint is a gain and/or shape constraint. The gain constraint allows the preservation of the relative energy between the channels (c 1 -c N ) while the shape constraint allows more stability by avoiding unnecessary filtering of spectral nulls. The transmitted parameters are the mono signal (x), in encoded form, and the parameters (p 1 -p N ) of the adaptive filters, preferably also encoded. The receiver reconstructs the signal of the different channels by applying the adaptive filters and possibly some additional post-processing.

Description

25 30 527 713 2 bearbetas de olika kanalernas signaler tillsammans, snarare än separat och individuellt. De två mest vanligt använda samstereokodningsteknikerna är kända som "Mitten/Sida"-stereokodning (M/S, eng. "Mid/Side") och intensitetsstereokodning, vilka vanligen tillämpas på delband av de stereo- eller multikanalssignaler som ska kodas. 527 527 713 2 the signals of the different channels are processed together, rather than separately and individually. The two most commonly used co-stereo coding techniques are known as "Mid / Side" stereo coding (M / S) and intensity stereo coding, which are commonly applied to subbands of the stereo or multi-channel signals to be coded.

M/ S-stereokodning liknar den beskrivna proceduren i stereo-FM-radio, på ett vis att den kodar och överför kanaldelbandens summa- och differenssignaler och därigenom utnyttjar redundans mellan kanaldelbanden. Strukturen och driften av en kodare som baserar sig på M/ S-stereokodning beskrivs, t.ex. i det amerikanska patentet US 5,285,498 av J .D. Johnston.M / S stereo coding is similar to the procedure described in stereo FM radio, in that it encodes and transmits the sum and difference signals of the channel subbands and thereby utilizes redundancy between the channel subbands. The structure and operation of an encoder based on M / S stereo coding are described, e.g. in U.S. Patent No. 5,285,498 to J.D. Johnston.

Intensitetsstereo å andra sidan klarar av att använda stereoirrelevans. Den överför kanalernas samlade intensitet (för de olika delbanden) tillsammans med viss lägesinformation som indikerar hur intensiteten är fördelad bland kanalerna. Intensitetsstereo tillhandahåller endast information om kanalernas spektrala storlek. Fasinformation forslas inte. Av denna orsak och eftersom tidsinterkanalsinformation (mer specifikt tidsdifferensen mellan kanalerna) är av stor psykoakustisk relevans särskilt vid lägre frekvenser kan intensitetsstereo endast användas vid höga frekvenser över t.ex. 2 kHz.Intensity stereo, on the other hand, is capable of using stereo relevance. It transmits the total intensity of the channels (for the different subbands) together with certain position information that indicates how the intensity is distributed among the channels. Intensity stereo only provides information about the spectral size of the channels. Phase information is not provided. For this reason and since time interchannel information (more specifically the time difference between the channels) is of great psychoacoustic relevance especially at lower frequencies, intensity stereo can only be used at high frequencies above e.g. 2 kHz.

Ett intensitetsstereokodningsförfarande beskrivs t.ex. i det europeiska patentet EP 0497413 av R. Veldhuis et al.An intensity stereo coding method is described e.g. in the European patent EP 0497413 by R. Veldhuis et al.

Ett nyligen utvecklat stereokodningsförfarande beskrivs t.ex. i en konferenspublikation med titeln "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, maj 2002, München, Tyskland av C. Faller et al. Detta förfarande är ett parametriskt ljudkodningsförfarande för multikanaler. Grundprincipen är att kombinera insignalerna från N kanaler c1, cg, cN på kodningssidan till en monosignal m. Monosignalen ljudkodas genom användning av vilken konventionell monoljudkodek som helst. Parallellt härleds parametrar från kanalsignalerna, vilka beskriver multikanalsbilden. Parametrarna kodas och 10 15 20 25 30 527 713 3 översånds till avkodaren, tillsammans med ljudbitströmmen. Avkodaren avkodar först monosignalen m' och återskapar sedan kanalsignalerna c1', c2',..., cN' baserat på multikanalsbildens parameterbeskrivning.A recently developed stereo coding method is described e.g. in a conference publication entitled "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, May 2002, Munich, Germany by C. Faller et al. This method is a parametric audio coding method for multichannels. The basic principle is to combine the input signals from N channels c1, cg, cN on the coding side into a mono signal m. The mono signal is sound coded using any conventional mono sound codec. In parallel, parameters are derived from the channel signals, which describe the multi-channel image. The parameters are coded and transmitted to the decoder, together with the audio bitstream. The decoder first decodes the mono signal m 'and then recreates the channel signals c1', c2 ', ..., cN' based on the parameter description of the multichannel image.

Principen för förfarandet med binaural inpassningskodning (eng. Binaural Cue Coding) (BCC) är att den överför den kodade monosignalen och så kallade BCC-parametrar. BCC-parametrarna innefattar kodade interkanalsnivåskillnader och interkanalstidsdifferenser för delband av de ursprungliga multikanalsinsignalerna. Avkodaren återskapar de olika kanalsignalerna genom att tillämpa nivå- och fasjusteringar per delband av monosignalen baserat på BCC-parametrarna. Fördelen över t.ex. M / S- eller intensitetsstereo är att stereoinformationen som innefattar tidsmåssig interkanalinformation överförs vid mycket lägre bithastigheter.The principle of the Binaural Cue Coding (BCC) method is that it transmits the coded mono signal and so-called BCC parameters. The BCC parameters include coded interchannel level differences and interchannel time differences for subbands of the original multichannel inputs. The decoder recreates the different channel signals by applying level and phase adjustments per subband of the mono signal based on the BCC parameters. The advantage over e.g. M / S or intensity stereo is that the stereo information that includes temporal interchannel information is transmitted at much lower bit rates.

Ett problem med de kodningstekniker för multikanaler enligt teknikens ståndpunkt som beskrivs ovan år att de fordrar höga bithastigheter för att tillhandahålla god kvalitet. Intensitetsstereo, om den tillämpas vid så låga bithastigheter som t.ex. endast några kbps, lider av det faktum att den inte tillhandahåller någon tidsrelaterad interkanalsinformation. Eftersom denna information år uppfattningsmåssigt viktig för låga frekvenser under t.ex. 2 kHz, klarar den inte av att tillhandahålla ett stereointryck vid sådana låga frekvenser.A problem with the prior art multichannel coding techniques described above is that they require high bit rates to provide good quality. Intensity stereo, if applied at such low bit rates as e.g. only a few kbps, suffers from the fact that it does not provide any time-related interchannel information. Since this information is perceptually important for low frequencies during e.g. 2 kHz, it is unable to provide a stereo impression at such low frequencies.

BCC klarar av att återskapa multikanalsbilden även vid låga frekvenser vid låga bithastigheter av t.ex. 3 kbps eftersom den även överför tidsrelaterad interkanalsinformation. Denna teknik fordrar emellertid beräkningskråvande tid-frekvens-transfonner för var och en av kanalerna, både vid kodaren och avkodaren. Dessutom optimerar BCC avbildningen på ett rent matematiskt sätt. Kånnetecknande artefakter inneboende i kodningsförfarandet kommer emellertid inte att försvinna.BCC is able to recreate the multichannel image even at low frequencies at low bit rates of e.g. 3 kbps because it also transmits time-related interchannel information. However, this technique requires computationally demanding time-frequency transformers for each of the channels, both at the encoder and the decoder. In addition, BCC optimizes the image in a purely mathematical way. However, characteristic artifacts inherent in the coding process will not disappear.

En annan teknik, beskriven i det amerikanska patentet US 5,434,948 av C.E. Holt et al., använder ett liknande angreppssätt för kodning av 10 15 20 25 30 527 713 \ 4 monosignalen och sidoinformation. I detta fall består sidoinformation av prediktorñlter och eventuellt en restsignal. Prediktorfiltren, estimerade genom en minsta-kvadrat-algoritrn, tillåter när de appliceras pà monosignalen prediktionen av multikanalsljudsignaler. Med denna teknik kan man nå mycket låga bithastigheter vid kodning av multikanalsljudkällor, emellertid på bekostnad av en kvalitetsförsämring.Another technique, described in U.S. Patent No. 5,434,948 to C.E. Holt et al., Use a similar approach for encoding the mono signal and side information. In this case, side information consists of predictor signals and possibly a residual signal. The predictor filters, estimated by a least-squares algorithm, when applied to the mono signal, allow the prediction of multi-channel audio signals. With this technology, very low bit rates can be achieved when encoding multichannel audio sources, however, at the expense of a quality degradation.

Slutligen, för fullständigheten skull, måste en teknik nämnas som används i 3D-ljud. Denna teknik syntetiserar de högra och vänstra kanalsignalema genom filtrering av ljudkällesignaler med så kallade huvudrelaterade filter.Finally, for the sake of completeness, a technique used in 3D audio must be mentioned. This technique synthesizes the right and left channel signals by filtering audio source signals with so-called main-related filters.

Denna teknik fordrar emellertid att de olika ljudkällesignalerna ska vara separerade och kan alltså inte allmänt tillämpas för stereo- eller multikanalskodning.However, this technology requires that the various audio source signals be separated and thus cannot be generally applied for stereo or multi-channel coding.

SAMMANFATTNING Även om prediktorfiltren är kända att vara optimala i en minsta-kvadrat- mening återskapar de inte alltid fullständigt de ursprungliga multikanalssignalernas förnimmelsekännetecken. I t.ex. fallet med stereokodning kan stereobildsinstabilitet inträffa, där ljudet hoppar slumpmässigt mellan vänster och höger. Vidare kan spektrala nollställen orsaka instabiliteter och leda till ett filter vars frekvenssvar vid dessa frekvenser är abnorm. Detta kan få filtret att utföra onödig förstärkning i vissa regioner och leda till mycket irriterande ljudliga artefakter, speciellt om signalerna är lâgpass- eller högpassfiltrerade.SUMMARY Although the predictor filters are known to be optimal in a least squares sense, they do not always completely recreate the sensory characteristics of the original multi-channel signals. In e.g. In the case of stereo coding, stereo image instability can occur, where the sound jumps randomly between left and right. Furthermore, spectral zeros can cause instabilities and lead to a filter whose frequency response at these frequencies is abnormal. This can cause the filter to perform unnecessary amplification in some regions and lead to very annoying audible artifacts, especially if the signals are low-pass or high-pass filtered.

Ett syfte med den föreliggande uppfinningen är att tillhandahålla ett förfarande och anordning för multikanalskodning som förbättrar den uppfattade kvaliteten för ljudsignalen. Ett ytterligare syfte med den föreliggande uppfinningen är att tillhandahålla ett sådant förfarande och en sådan anordning, vilka fordrar representation med låg bithastighet. 10 15 20 25 30 527 713 De ovanstående syftena ästadkoms genom förfaranden och anordningar enligt de bifogade patentkraven. Allmänt sett, kombineras signalerna för de olika kanalerna på kodningssidan till en huvudsignal. En uppsättning av filter, företrädesvis ett för varje kanal, härleds. När ett filter appliceras på huvudsignalen återskapar den signalen för den respektive kanalen under en förnimmelsevillkorsbegränsning. Förnimmelsevillkorsbegränsningen är en förstärknings- och/ eller formvillkorsbegränsning. Förstärkningsvillkors- begränsningen möjliggör bevarandet av den relativa energin mellan kanalerna medan formvillkorsbegränsningen möjliggör mer stabilitet genom att undvika onödig filtrering av spektrala nollställen. De överförda parametrarna är huvudsignalen, i kodad form, och filtrets parametrar, företrädesvis också kodade. Mottagaren återskapar de olika kanalernas signaler genom att applicera filtren och kanske viss tillkommande efterbearbetning.An object of the present invention is to provide a method and apparatus for multichannel coding which improves the perceived quality of the audio signal. A further object of the present invention is to provide such a method and such an apparatus which require low bit rate representation. The above objects are achieved by methods and devices according to the appended claims. Generally, the signals for the different channels on the coding side are combined into one main signal. A set of filters, preferably one for each channel, is derived. When a filter is applied to the main signal, it recreates the signal for the respective channel under a perceptual condition limitation. The perception condition limitation is a reinforcement and / or shape condition limitation. The gain condition limitation enables the preservation of the relative energy between the channels, while the shape condition limitation enables more stability by avoiding unnecessary filtering of spectral zeros. The transmitted parameters are the main signal, in coded form, and the parameters of the filter, preferably also coded. The receiver recreates the signals of the different channels by applying the filters and perhaps some additional finishing.

En fördel med den föreliggande uppfinningen är att förnimmelseartefakter minskas när ljudsignaler avkodas. Den fordrade överföringsbithastigheten hålls även på samma gång på en mycket låg nivå.An advantage of the present invention is that perceptual artifacts are reduced when audio signals are decoded. The required transfer bit rate is also kept at a very low level at the same time.

KORT FIGURBESKRIVNING Uppfinningen, tillsammans med ytterligare syften och fördelar därmed förstås bäst genom hänvisning till den följande beskrivningen gjord tillsammans med de medföljande ritningarna, i vilka: FIG. 1 är ett blockdiagram av ett system för överföring av multikanalssignaler; FIG. 2a är ett blockdiagram av en utföringsform av en kodare i en sändare enligt den föreliggande uppfinningen; FIG. 2b är ett blockdiagram av en utföringsform av en avkodare i en mottagare enligt den föreliggande uppfinningen; FIG. 3a är ett blockdiagram av en annan utföringsform av en kodare i en sändare enligt den föreliggande uppfinningen; 10 15 20 25 30 527 713 6 FIG. 3b är ett blockdiagram av en annan utföringsform av en avkodare i en mottagare enligt den föreliggande uppñnningen; FIG. 4 är ett blockdiagram av en utföringsform av en filteranpassningsenhet enligt den föreliggande uppfinningen; FIG. 5 är diagram som illustrerar effekterna av otillräcklig reproduktion av sidosignaler i ett system enligt teknikens ståndpunkt; FIG. 6 är ett diagram som illustrerar effekter av spektrala nollställen i system enligt teknikens ståndpunkt; FIG. 7 är ett blockdiagram som illustrerar kombinationsmöjligheter i kanalfiltersektioner enligt den föreliggande uppfinningen; FIG. 8 är ett blockdiagram av en utföringsform av en kodare som utnyttjar partiell kombinerad kodning av en stereosignal; FIG. 9 är ett blockdiagram som illustrerar användningen av uppdelning i frekvensdelband; FIG. 10 är ett sammansatt diagram som illustrerar överlappande analys för kodning och avkodning; samt FIG. 11 är ett flödesdiagram av de grundläggande stegen av en utföringsform av ett kodningsförfarande enligt den föreliggande uppfinningen.BRIEF DESCRIPTION OF THE DRAWINGS The invention, together with further objects and advantages thereof, is best understood by reference to the following description taken in conjunction with the accompanying drawings, in which: FIG. 1 is a block diagram of a system for transmitting multichannel signals; FIG. 2a is a block diagram of an embodiment of an encoder in a transmitter according to the present invention; FIG. 2b is a block diagram of an embodiment of a decoder in a receiver according to the present invention; FIG. 3a is a block diagram of another embodiment of an encoder in a transmitter according to the present invention; 10 15 20 25 30 527 713 6 FIG. 3b is a block diagram of another embodiment of a decoder in a receiver according to the present invention; FIG. 4 is a block diagram of an embodiment of a filter fitting unit according to the present invention; FIG. 5 are diagrams illustrating the effects of insufficient reproduction of side signals in a prior art system; FIG. 6 is a diagram illustrating effects of spectral zeros in prior art systems; FIG. 7 is a block diagram illustrating combination possibilities in channel filter sections according to the present invention; FIG. 8 is a block diagram of an embodiment of an encoder utilizing partial combined coding of a stereo signal; FIG. 9 is a block diagram illustrating the use of division into frequency subbands; FIG. 10 is a composite diagram illustrating overlapping analysis for coding and decoding; and FIG. 11 is a fate diagram of the basic steps of an embodiment of a coding method according to the present invention.

DET ALJERAD BESKRIVNING Fig. l illustrerar ett typiskt system 1, i vilket den föreliggande uppfinningen med fördel kan utnyttjas. En sändare 10 innefattar en antenn 12 inklusive därmed förknippad maskinvara och programvara för att kunna sända radiosignaler 5 till en mottagare 20. Sändaren 10 innefattar bland andra delar en multikanalskodare 14, vilken omvandlar signaler från ett antal ingångskanaler 16 till utsignaler som är lämpliga för radioöverföring.THE ALLEGED DESCRIPTION Fig. 1 illustrates a typical system 1, in which the present invention can be used to advantage. A transmitter 10 includes an antenna 12 including associated hardware and software for transmitting radio signals 5 to a receiver 20. The transmitter 10 includes, among other parts, a multi-channel encoder 14, which converts signals from a plurality of input channels 16 to output signals suitable for radio transmission.

Exempel på lämpliga multikanalskodare 14 beskrivs i detalj längre ner.Examples of suitable multi-channel encoders 14 are described in detail below.

Ingångskanalernas 16 signaler kan tillhandahållas från t.ex. en ljudsignalslagringsenhet 18, såsom en datañl med digital representation av ljudinspelningar, magnetiska band- eller vinylskiveinspelningar av ljud etc. lngångskanalernas 16 signaler kan också tillhandahållas "levande", t.ex. 10 15 20 25 30 527 713 7 från en uppsättning av mikrofoner 19. Ljudsignalerna digitaliseras, om de inte redan år i digital form, innan de kommer in i multikanalskodaren 14.The signals of the input channels 16 can be provided from e.g. an audio signal storage unit 18, such as a data cell with digital representation of audio recordings, magnetic tape or vinyl record recordings of sound, etc. The signals of the input channels 16 can also be provided "live", e.g. 10 15 20 25 30 527 713 7 from a set of microphones 19. The audio signals, if not already in digital form, are digitized before entering the multi-channel encoder 14.

På mottagarsidan 20 hanterar en antenn 22 med därmed förknippad maskinvara och programvara det faktiska mottagandet av de radiosignaler 5 som representerar polyfoniska ljudsignaler. Här utförs typiska funktionaliteter, såsom t.ex. felkorrigering. En avkodare 24 avkodar de mottagna radiosignalerna 5 och omvandlar det ljuddata som bärs därav till signaler för ett antal utgångskanaler 26. Utgångskanalerna kan tillhandahållas till t.ex. högtalare 29 för omedelbar presentation, eller kan lagras i ett ljudsignalsminne 28 av något slag.On the receiver side 20, an antenna 22 with associated hardware and software handles the actual reception of the radio signals 5 representing polyphonic audio signals. Here, typical functionalities are performed, such as e.g. error correction. A decoder 24 decodes the received radio signals 5 and converts the audio data carried therefrom into signals for a number of output channels 26. The output channels can be provided to e.g. speakers 29 for immediate presentation, or can be stored in an audio signal memory 28 of some kind.

Systemet 1 kan till exempel vara ett telefonkonferenssystem, ett system för att tillhandahålla ljudservice eller andra ljudtillämpningar. I vissa system, såsom t.ex. telefonkonferenssystemet måste kommunikationen vara av duplextyp, medan t.ex. distribution av musik från en servicetillhandahållare till en abonnent väsentligen kan vara av en envägstyp. Överföringen av signaler från sändaren 10 till mottagaren 20 kan också utföras med vilka andra medel som helst, t.ex. genom såväl olika typer av elektromagnetiska vågor, kablar eller fibrer som kombinationer därav.System 1 may be, for example, a conference call system, a system for providing audio service or other audio applications. In some systems, such as e.g. the conference call system, the communication must be of the duplex type, while e.g. Distribution of music from a service provider to a subscriber can be essentially one-way. The transmission of signals from the transmitter 10 to the receiver 20 can also be performed by any other means, e.g. through various types of electromagnetic waves, cables or som wires as well as combinations thereof.

Fig. 2a illustrerar en utföringsform av en multikanalskodare 14 enligt den föreliggande uppfinningen. Ett antal kanalsignaler c1, eg, ..., cN tas emot vid separate ingångar 16: 1-16:N.Fig. 2a illustrates an embodiment of a multi-channel encoder 14 according to the present invention. A number of channel signals c1, eg, ..., cN are received at separate inputs 16: 1-16: N.

Kanalsignalerna ansluts till en linjärkombinatíonsenhet 34. I den föreliggande utföringsformen summeras alla kanalsignalerna tillsammans för att bilda en monosignal x. Vilken förutbestämd linjärkombination som helst av en eller flera av kanalsignalerna kan emellertid användas som ett alternativ, inklusive rena kanalsignaler. En ren summa kommer emellertid att förenkla de flesta matematiska operationerna. Monosignalen x tillhandahålls som en insignal 42 till en kanalfiltersektion 130. Vidare tillhandahålls monosignalen x till, och kodas i, en monosignalskodare 38 för 1.0 15 20 25 30 527 713 I I 8 att tillhandahålla kodningsparametrar px som representerar monosignalen x.The channel signals are connected to a linear combining unit 34. In the present embodiment, all the channel signals are summed together to form a mono signal x. However, any predetermined linear combination of one or more of the channel signals may be used as an alternative, including pure channel signals. However, a sheer sum will simplify most mathematical operations. The mono signal x is provided as an input signal 42 to a channel ektionterter section 130. Further, the mono signal x is provided to, and encoded in, a mono signal encoder 38 for providing coding parameters px representing the mono signal x.

Monosignalskodaren verkar enligt någon lämplig monosignalskodnings- teknik. Många sådana tekniker finns tillgängliga inom känd teknik. De faktiska detaljerna för kodningstekniken år inte av betydelse för att möjliggöra den föreliggande uppfinningen och diskuteras därför inte vidare.The mono signal encoder operates according to any suitable mono signal encoding technique. Many such techniques are available in the art. The actual details of the coding technique are not important in enabling the present invention and are therefore not discussed further.

Kanalsignalerna är också kopplade till kanalfiltersektionen 130. I den föreliggande utföringsformen, ansluts varje kanalsignal till en respektive ñlteranpassningsenhet 30:1-30:N. Filteranpassningsenheterna utför ett återskapande av en respektive kanalsignal när de appliceras på monosignalen x. Koefficienter för ñlteranpassningsenheterna 30:1-30:N optimeras enligt den föreliggande uppfinningen under en förnimmelsevillkorsbegränsning. Filteranpassningsenheternas 30:l-30:N optimerade koefñcienter kan också erhållas åtminstone delvis i en samoptimering av två eller flera av kanalsignalerna.The channel signals are also connected to the channel filter section 130. In the present embodiment, each channel signal is connected to a respective filter adapter 30: 1-30: N. The filter adapters perform a reproduction of a respective channel signal when applied to the mono signal x. Coefficients for the filter adapters 30: 1-30: N are optimized according to the present invention under a perceptual condition constraint. The optimized coefficients of the filter adapters 30: 1-30 can also be obtained at least in part in a co-optimization of two or more of the channel signals.

Kanalñltersektionens 130 utsignal innefattar N uppsättningar filter- parametrar pi-pu. Dessa ñlterparametrar p1-pN kodas typiskt sett separat eller tillsammans för att bli lämpliga för överföring. Filterparametrarna pl-pN och monosignalen x är tillräckliga för att möjliggöra rekonstruktion av alla kanalsignaler. De kodade ñlterparametrarna p1-pN och de kodnings- parametrar px som representerar monosignalen multíplexeras i den föreliggande utföringsformen i en multiplexerare 40 till en utsignal 52, klar för överföring.The output of the channel filter section 130 includes N sets of filter parameters pi-pu. These sub-parameters p1-pN are typically encoded separately or together to be suitable for transmission. The filter parameters p1-pN and the mono signal x are sufficient to enable reconstruction of all channel signals. The coded sub-parameters p1-pN and the coding parameters px representing the mono signal are multiplexed in the present embodiment in a multiplexer 40 to an output signal 52, ready for transmission.

Fig. 2b illustrerar en utföringsform av en multikanalsavkodare 24 enligt den föreliggande uppfinningen. Avkodaren 24 i fig. 2b är lämplig för avkodning av multikanalssignaler kodade med kodaren i fig. 2a. En insignal 54 tas emot och tillhandahålls till en avmultiplexerare 56, vilken delar upp insignalen 54 i kodningsparametrar px som representerar monosignalen x och ett antal uppsättningar kodade filterparametrar p1-pN. lO 15 20 25. 30 527 713 9 De kodningsparametrar px som representerar monosignalen x tillhandahålls till en monosignalsavkodare 64, i vilken de kodningsparametrar px som representerar monosignalen x används för att bilda en avkodad monosignal x" enligt någon lämplig avkodningsteknik som associeras med kodningstekniken använd i fig. 2a. Många sådana tekniker finns tillgängliga inom känd teknik. De faktiska detaljerna för kodningstekniken är inte av betydelse för att möjliggöra den föreliggande uppfinningen och diskuteras därför inte vidare. Den avkodade monosignalen x" tillhandahålls till en kanalfiltersektion 160.Fig. 2b illustrates an embodiment of a multi-channel decoder 24 according to the present invention. The decoder 24 in Fig. 2b is suitable for decoding multi-channel signals encoded with the encoder in fi g. 2a. An input signal 54 is received and provided to a demultiplexer 56, which divides the input signal 54 into coding parameters px representing the mono signal x and a number of sets of coded filter parameters p1-pN. The coding parameters px representing the mono signal x are provided to a mono signal decoder 64, in which the coding parameters px representing the mono signal x are used to form a decoded mono signal x "according to any suitable decoding technique associated with coding used in coding. Many such techniques are available in the prior art. The actual details of the coding technique are not important to enable the present invention and are therefore not discussed further. The decoded mono signal x "is provided to a channel filter section 160.

De kodade ñlterparametrama tillhandahålls även till kanalñltersektionen 160, där de avkodas och används för att definiera kanalfilter 60:1-60:N. De på så sätt definierade respektive kanalñltren 60:l-60:N appliceras på den avkodade monosignalen x" varvid respektive kanalsignaler c"1-c"N återbildas och tillhandahålls på utgångar 26: l-26:N.The encoded parlter parameters are also provided to the channel ektionlter section 160, where they are decoded and used to define channel 60lter 60: 1-60: N. The respective channels 60: 1-60: N thus defined are applied to the decoded mono signal x ", the respective channel signals c" 1-c "N being regenerated and provided at outputs 26: 1-26.

I de flesta utföringsformer i den föreliggande presentationen används en monosignal som en huvudsignal för att återskapa kanalsignalerna vid kodning eller avkodning. I ett allmänt angreppssätt kan emellertid vilken förutbestämd linjärkombination som helst av signaler valda bland kanalsignalerna användas som en sådan huvudsignal. Det optimala valet av förutbestämd linjärkombination beror på den faktiska tillämpningen och implementationen. En enkel kanalsignal kan också utgöra en möjlig sådan förutbestämd linjär kombination.In most embodiments of the present presentation, a mono signal is used as a main signal to reproduce the channel signals during encoding or decoding. In a general approach, however, any predetermined linear combination of signals selected from the channel signals may be used as such a main signal. The optimal choice of predetermined linear combination depends on the actual application and implementation. A single channel signal may also constitute a possible such predetermined linear combination.

En annan utföringsform av en multikanalskodare 14 enligt den föreliggande uppfinningen illustreras i flg. 3a. Liknande delar betecknas med lika hänvisningssiffror och endast skillnaderna diskuteras nedan.Another embodiment of a multi-channel encoder 14 according to the present invention is illustrated in Figs. 3a. Similar parts are denoted by like reference numerals and only the differences are discussed below.

Linjärkombinationsenheten 34 tillhandahåller såsom tidigare en förutbestämd linjärkombination av kanalsignalerna till monosignalskodaren 38. In denna utföringsform är emellertid den signal som associeras med monosignalen x istället en avkodad version x" av de kodningsparametrar px 10 15 20 25 30 527 713 c 10 som representerar monosignalen x. Ett sådant arrangemang, hänvisat till såsom ett angreppssätt med sluten krets kommer tillåta vissa kompenseringar av onoggrannheter i kodningen av monosignalen, såsom beskrivs vidare nedan.As before, the linear combining unit 34 provides a predetermined linear combination of the channel signals to the mono signal encoder 38. In this embodiment, however, the signal associated with the mono signal x is instead a decoded version x "of the coding parameters px 10 20 25 30 527 713 c 10 representing the mon signal x. Such an arrangement, referred to as a closed circuit approach, will allow some compensations for inaccuracies in the coding of the mono signal, as further described below.

Den föreliggande utföringsformens linjärkombinationsenhet 34 kombinerar även kanalsignalerna i N-1 förutbestämda linjärkombinationer c*1-c*N, vilka tjänar såsom faktiska insignaler till kanalfiltersektionen 130. De N-l förutbestämda linjärkombinationerna c*1-c*N-1 bör vara sinsemellan linjärt oberoende. Linjärkombinationema c*i-c*N-i behöver inte nödvändigtvis innefatta något bidrag från alla kanalsigrialer. Termen "linjärkombination" bör i detta sammanhang användas såsom även innefattande specialfallet där en faktor för en komponent kan sättas lika med noll. Faktum är att i den enklaste uppställningen kan linjärkombinationerna c*1-c*N-1 vara identiska med kanalsignalerna c*1-c*N-1. Genom att utnyttja en avkodad monosignal x" på avkodarsidan kan de ursprungliga kanalsignalerna återställas.The linear combining unit 34 of the present embodiment also combines the channel signals in N-1 predetermined linear combinations c * 1-c * N, which serve as actual inputs to the channel filter section 130. The N-1 predetermined linear combinations c * 1-c * N-1 should be mutually independent. The linear combinations c * i-c * N-i do not necessarily have to include any contribution from all channel signals. The term "linear combination" should be used in this context as also including the special case where a factor of a component can be set equal to zero. In fact, in the simplest arrangement, the linear combinations c * 1-c * N-1 may be identical to the channel signals c * 1-c * N-1. By utilizing a decoded mono signal x "on the decoder side, the original channel signals can be restored.

De modifierade kanalsignalerna ansluts även i denna utföringsform till kanalfiltersektionen 130, i vilken N-l uppsättningar av filterkoefficienter härleds, nu motsvarande de modifierade kanalsignalerna. Koefficienterna för filteranpassningsenheterna 30:1-30:N optimeras enligt den föreliggande uppfinningen under en förnimmelsevillkorsbegränsning.The modified channel signals are also connected in this embodiment to the channel filter section 130, in which N-1 sets of filter coefficients are derived, now corresponding to the modified channel signals. The coefficients of the filter fittings 30: 1-30: N are optimized according to the present invention under a perceptual condition constraint.

Kanalfiltersektionens 130 utgång innefattar N-l uppsättningar av filterparametrar p*1-p*N-1. Dessa filterparametrar p*1-p*N-1 kodas typiskt sett separate eller tillsammans för att bli lämpliga för överföring. De kodade filterparametrarna p* 1-p*N-1 och de kodade parametrar px som representerar monosignalen x överförs i den föreliggande utföringsformen separat.The output of the channel filter section 130 comprises N-1 sets of filter parameters p * 1-p * N-1. These filter parameters p * 1-p * N-1 are typically encoded separately or together to be suitable for transmission. The coded ter filter parameters p * 1-p * N-1 and the coded parameters px representing the mono signal x are transmitted in the present embodiment separately.

Fig. 3b illustrerar en annan utföringsform av en multikanalsavkodare 24 enligt den föreliggande uppfinningen. Avkodaren 24 i Fig. 3b är lämplig för avkodning av multikanalssignaler kodade av kodaren i fig. 3a. Kodnings- parametrar px som representerar monosignalen x och en uppsättning kodade 10 15 20 25 30 527 713 11 filterparametrar p*i-p*N-1 tas emot. De kodningsparametrar px som representerar monosignalen x används för att bilda en avkodad monosignal x" i en monosignalsavkodare 64 i analogi med tidigare utföringsform.Fig. 3b illustrates another embodiment of a multi-channel decoder 24 according to the present invention. The decoder 24 in Fig. 3b is suitable for decoding multi-channel signals encoded by the encoder in fi g. 3a. Coding parameters px representing the mono signal x and a set of coded parameters p * i-p * N-1 are received. The encoding parameters px representing the mono signal x are used to form a decoded mono signal x "in a mono signal decoder 64 in analogy to the previous embodiment.

Filterparametrarna p*1-p*N-1 tillhandahålls likaledes till kanalfiltersektionen 160 för att erhålla N-1 avkodade modiñerade kanalsígnaler c*i-c*N-i. En linjärkombinationsenhet 74 används sedan för att tillhandahålla rekonstruerade kanalsignaler c"1-c“N från de modifierade kanalsignalerna c*1-c*1v_i och den avkodade monosignalen x".The filter parameters p * 1-p * N-1 are likewise provided to the channel filter section 160 to obtain N-1 decoded modified channel signals c * i-c * N-i. A linear combiner 74 is then used to provide reconstructed channel signals c "1-c" N from the modified channel signals c * 1-c * 1v_i and the decoded mono signal x ".

För att uppfatta den viktiga betydelsen av förnimmelsevillkorsbegräns- ningarna kommer ett exempel med filterkodning enligt teknikens ståndpunkt att beskrivas mer i detalj, i grunden hänvisande till det amerikanska patentet US 5,434,948. Denna multikanalskodning möjliggör låga bithastigheter om överföringen av restsignaler utelämnas. För att härleda kanalrekonstruktionsfiltret beräknar en felminimeringsprocedur baserad på ett minsta-kvadrat- eller viktat minsta-kvadrat-koncept filtren så att dess utsignal ê(n) bäst överensstämmer med målsignalen c(n).To understand the important significance of the perceptual limitation constraints, an example of prior art kltercoding will be described in more detail, basically referring to U.S. Patent No. 5,434,948. This multi-channel coding enables low bit rates if the transmission of residual signals is omitted. To derive the channel reconstruction filter, an error minimization procedure based on a least squares or weighted least squares concept calculates the filters so that its output signal ê (n) best matches the target signal c (n).

För att beräkna filtret kan flera felmått användas. Minsta-kvadrat-felet eller det viktade minsta-kvadrat-felet är välkända och är beräkningsmässigt billiga att implementera. Enligt minsta-kvadrat-angreppssättet gäller filtret [rf en dataram, där "uc" hänvisar till "icke villkorsbegränsad", och väljs sådan att det minimerar det kvadrerade felet mellan målsignalen och filterutgången, dvs. kvadraten av skillnaden r (n)=c(n)-ê,,c(n), där n UC numrerar samplen i en dataram. Detta fel uttrycks såsom: frame end euws = Z rwoly ~ n=fmmeslnrl Detta leder till det följande linjära ekvationssystemet för ñlterkoefñcientvektorn Ef: 10 15 20 25 527 713 12 där å” är den symmetriska kovariansmatrisen för monosignalen x(n): frameend 5,, =i Zxbi-Idxvl-Jll, Lk e 1, n=frameslurl och där L” är en vektor av korskorrelationer för signaler x(n) och c(n): [m =[ fnïmiiidn -k)c(n):l, k e I. n = frame start Såsom nämndes vidare ovan kan emellertid förnimmelsekarakteristiken inte fullständigt bestämmas av en ren matematisk minimering.Several error measurements can be used to calculate the filter. The least squares error or the weighted least squares error are well known and are computationally inexpensive to implement. According to the least squares approach, the filter [rf applies to a data frame, where "uc" refers to "non-conditional", and is selected to minimize the squared error between the target signal and the filter output, i.e. the square of the difference r (n) = c (n) -ê ,, c (n), where n UC numbers the samples in a data frame. This error is expressed as: frame end euws = Z rwoly ~ n = fmmeslnrl This leads to the following linear system of equations for the intercoefficient vector Ef: 10 15 20 25 527 713 12 where å 'is the symmetric covariance matrix of the mono signal x (n): frameend 5, , = i Zxbi-Idxvl-Jll, Lk e 1, n = frameslurl and where L ”is a vector of cross-correlations for signals x (n) and c (n): [m = [fnïmiiidn -k) c (n): l, ke I. n = frame start As mentioned further above, however, the perception characteristic cannot be completely determined by a pure mathematical minimization.

En mycket viktig förnimmelsekarakteristik för multikanalssignaler är deras energi och i synnerhet de relativa nivåerna mellan multikanalsljud- signalerna. I fallet med stereokodning med förfaranden enligt teknikens ståndpunkt kan irriterande stereobildsinstabilitet där ljudkällan hoppar periodiskt från vänster till höger bli resultatet. Vidare, eftersom endast ett filter behövs i stereokodning åstadkoms ingen direkt kontroll över vänster- och högerförutsägelserna. Enligt den föreliggande uppfinningen utnyttjas en förstärkningsvillkorsbegränsning därför med fördel under optimerings- procedurer. I det sammanhanget kan det noteras att ett filter per kanal i grunden behövs, jfr. fig. 2a och fig. 2b ovan. l vissa situationer kan de förutsagda kanalerna sakna frekvensinnehåll ovanför eller under en viss frekvens. Detta inträffar om till exempel kanalen är högpassñltrerad eller är resultatet av en banduppdelningsprocedur.A very important sensory characteristic for multichannel signals is their energy and in particular the relative levels between the multichannel audio signals. In the case of stereo coding with prior art methods, annoying stereo image instability where the sound source periodically jumps from left to right can be the result. Furthermore, since only one filter is needed in stereo coding, no direct control over the left and right predictions is achieved. According to the present invention, therefore, a gain condition limitation is advantageously utilized during optimization procedures. In this context, it can be noted that one filter per channel is basically needed, cf. fi g. 2a and fi g. 2b above. In some situations, the predicted channels may lack frequency content above or below a certain frequency. This occurs if, for example, the channel is high-pass or is the result of a band splitting procedure.

Spektrala nollställen kan orsaka instabiliteter och leda till ñltersvar som ger onödig förstärkning och ljudartefakter vid låg frekvens. Enligt den 10 15 20 25 30 527 713 13 föreliggande uppfinningen utnyttjas en formvillkorsbegränsning därför med fördel under optimeringsprocedurer.Spectral zeros can cause instabilities and lead to sub-responses that provide unnecessary amplification and low-frequency sound artifacts. According to the present invention, therefore, a shape condition limitation is advantageously utilized during optimization procedures.

Fig. 4 illustrerar de grundläggande idéerna för den villkorsbegränsade minimeringsproceduren på kodarsidan enligt den föreliggande uppfinningen i en utföringsform som har två kanaler (stereofallet) och ett linjärñlter 31. Ett filter 31 som svarar för rekonstruktion av kanal cl som har filterkoefñcienter hu, härleds enligt en villkorsbegränsad felminimeringsprocedur i en optimeringsenhet 32. Filtret hc, tar som insignal den kombinerade kanalsignalen, dvs. monosignalen x(n), vilken i denna utföringsform är en linjär kombination av de två kanalsignalerna cl och c2: x(") = 7c1 'C1(n)+ 7:2 'c2(n) 1 och härleder utsignalen êl(n) från den. Faktorerna yd och yc, bestämmer hur kanalsignalerna kombineras. En möjlighet är att sätta 7,, till en faktor 2y och yc, till 2(l-y). I detta fall kommer monosignalen vara en viktad summa av kanalerna. I synnerhet är 7 = 0.5 en lämplig inställning, i vilket fall båda kanalerna är viktade lika. En annan lämplig inställning kan vara 76, = -yw i vilket fall monosignalen är differensen mellan kanalsignalerna.Fig. 4 illustrates the basic ideas of the conditional minimization procedure on the encoder side according to the present invention in an embodiment having two channels (stereo case) and a linear filter 31. A filter 31 responsible for reconstructing channel c1 having interferential coefficients condition-limited error minimization procedure in an optimization unit 32. The filter hc, takes as input signal the combined channel signal, ie. the mono signal x (n), which in this embodiment is a linear combination of the two channel signals c1 and c2: x (") = 7c1 'C1 (n) + 7: 2' c2 (n) 1 and derives the output signal êl (n) from it. The factors yd and yc, determine how the channel signals are combined. One possibility is to set 7 ,, to a factor of 2y and yc, to 2 (ly) .In this case the mono signal will be a weighted sum of the channels. = 0.5 a suitable setting, in which case both channels are weighted equally, another suitable setting may be 76, = -yw in which case the mono signal is the difference between the channel signals.

Den viktade kombinationen av de individuella kanalsignalerna för att forma monosignalen kan allmänt sett även vara kombinationen av ñltrerade versioner av de respektive kanalsignalerna. Ett sådant angreppssätt kommer att kallas förfiltrering. Detta kan vara användbart om angreppssättet implementeras i exciteringsdomänen eller allmänt en viktad signaldomän.The weighted combination of the individual channel signals to form the mono signal can generally also be the combination of filtered versions of the respective channel signals. Such an approach will be called alteration. This can be useful if the approach is implemented in the excitation domain or generally a weighted signal domain.

Kanalerna kan till exempel förfiltreras genom ett LPC-restfilter (linjär prediktiv kodning, eng. Linear Predictive Coding) för monosignalen.The channels can, for example, be filtered by an LPC (Linear Predictive Coding) filter for the mono signal.

I det följande kommer mono- och vänster- och höger-kanalen allmänt antas vara någon förfiltrerad version av de verkliga mono-, vänster- och högerkanalerna. Vid återskapning av kanalerna kommer efterfiltreringssteget 10 15 20 25 30 527 713 14 med mono-LPC-syntetiseringsñltret behövas för att komma tillbaka till signaldomänerna.In the following, the mono and left and right channels will generally be assumed to be a modified version of the actual mono, left and right channels. Upon re-creation of the channels, the post-filtering step with the mono-LPC synthesizer will be needed to return to the signal domains.

I det följande diskuteras fallet yfi, = 1/2 och 7,2 =l/2 mer i detalj.In the following, the case y fi, = 1/2 and 7.2 = l / 2 are discussed in more detail.

I fall där 11,, är ett FIR-filter (finit impulssvar, eng. Finite Impulse Response) är êl(n) en linjärkombination av försenade versioner av signal x(n): êl(n) = Ehn x(n - k) , Irel där indexupsättningen är I =[iminKimax]. Filterparametrarna pi innefattar ñlterkoefficienterna llc, och kanske nödvändigt tillkommande data som definierar filtret.In cases where 11 ,, is a FIR filter (finite impulse response), êl (n) is a linear combination of delayed versions of signal x (n): êl (n) = Ehn x (n - k) , Irel where the index set is I = [iminKimax]. The filter parameters pi include the koltercoefficients llc, and perhaps necessary additional data that defines the filter.

Om man tillämpar t.ex. kodningsförfarandet som presenteras i US 5,434,948 reproduceras differenssignalen av två kanalsignaler genom ett filter. I fig. 5 illustreras de högra och vänstra signalerna genom kurvorna 301 respektive 302. Antag att representationen inte är ideal, vilket ger en något större differens än måldifferensen över hela ramen. Detta kommer att leda till en återskapad högersignal 303 vid avkodarsidan som är något lägre än originalhögersignalen, och en återskapad vånstersignal 304 som är något högre än originalvänstersignalen. Upplevelsen av en sådan artefakt är att högerkanalens volym minskas och vänsterkanalens volym ökas. Om sådana artefakter vidare varierar i tiden kommer ljudet att pendla fram och tillbaka mellan den högra och vänstra kanalen. En förstärkningsvillkorsbegränsning kan förbättra en sådan situation.If you apply e.g. the coding method presented in US 5,434,948, the difference signal is reproduced by two channel signals through a filter. I fi g. 5, the right and left signals are illustrated by curves 301 and 302, respectively. Assume that the representation is not ideal, which gives a slightly larger difference than the target difference over the whole frame. This will result in a recreated right signal 303 at the decoder side which is slightly lower than the original right signal, and a recreated left signal 304 which is slightly higher than the original left signal. The experience of such an artifact is that the volume of the right channel is reduced and the volume of the left channel is increased. If such artifacts further vary in time, the sound will oscillate back and forth between the right and left channels. A reinforcement condition limitation can improve such a situation.

Det ñnns flera vägar att implementera förstärkningsvillkorsbegränsningen.There are several ways to implement the reinforcement condition limitation.

Ett möjligt angreppssätt år att ha en hård villkorsbegränsning, dvs. exakt energiöverensstämmelse mellan originalkanalen och den skattade kanalen, eller att lägga på en lös förstärkningsvillkorsbegränsning sådan att utgångs- 10 15 20 25 527 713 15 kanalen har en föreskriven energi EC, , vilken inte nödvändigtvis är lika med den ursprungliga kanalsignalsenergin.A possible approach is to have a strict conditional restriction, ie. exact energy correspondence between the original channel and the estimated channel, or to impose a loose gain condition limitation such that the output channel has a prescribed energy EC, which is not necessarily equal to the original channel signal energy.

Det villkorsbegränsade minimeringsproblemet kan lätt lösas med Lagrange- förfarandet, dvs. Lagrangefunktionen: frameend frameend L(/l)= ZÅnY + ÄKEÜ - Eêflnyj n=frame stnrl n-fiame start Den optimala lösningen ger ett ñlter Qc, som är proportionellt mot det icke villkorsbegränsade ñltret Ei: = fm. Proportionalitetsfaktorn är: E01 gfl fianue end ' 2 avxny n=framesuzrl Det förstârkningsvillkorsbegränsade ñltret blir därigenom hå' = gdfifï .The conditional minimization problem can be easily solved with the Lagrange procedure, ie. The layer range function: frameend frameend L (/ l) = ZÅnY + ÄKEÜ - Eê fl nyj n = frame stnrl n- fi ame start The optimal solution gives an ñlter Qc, which is proportional to the non-conditional ñltret Ei: = fm. The proportionality factor is: E01 g fl fi anue end '2 avxny n = framesuzrl The gain-condition-limited filter thus becomes high' = gd fi fï.

Om den föreliggande kodningsprincipen används i ett begränsat frekvensband kan en kanalsignal se ut som kurva 305 i Fig. 6. Ingen intensitet finns under frekvens fi eller över frekvens fz. En ren matematisk optimering ger emellertid upphov till en kurva 306, vilken visar upp viss begränsad effekt även under och över frekvenserna fl respektive fg. Sådana artefakter är förnimbara.If the present coding principle is used in a limited frequency band, a channel signal may look like curve 305 in Fig. 6. No intensity is found below frequency f1 or above frequency fz. However, a purely mathematical optimization gives rise to a curve 306, which shows some limited power even below and above the frequencies f1 and fg, respectively. Such artifacts are perceptible.

För att lägga på en viss spektralform på filtret måste en uppsättning linjära villkorsbegränsningar läggas på filtret. Dessa villkorsbegränsningar skulle allmänt sett vara av ett antal mindre än antalet koefficienter för filtret.To apply a certain spectral shape to the filter, a set of linear condition constraints must be applied to the filter. These condition constraints would generally be of a number less than the number of coefficients of the filter.

Till exempel, om man vill sätta en villkorsbegränsning för ett spektralt nollställe vid 0 kHz är en lämplig villkorsbegränsning: 10 15 20 25 30 527 713 16 Zht.(k)= fr =0- kel Allmänt sett kan formvillkorsbegränsningen formuleras genom en matris och en vektor sådana att :wc ' Från teorin om villkorsbegränsade minsta-kvadrater är det optimala filter som uppfyller dessa begränsningar: ai” =aï ßllífhïëllcllwf -ifhfl Denna villkorsbegränsning är speciellt användbar när det är känt a priori att kanalen inte har något frekvensinnehåll i ett visst frekvensområde.For example, if you want to set a condition limit for a spectral zero point at 0 kHz, a suitable condition limit is: 10 15 20 25 30 527 713 16 Zht. (K) = fr = 0- kel In general, the shape condition limit can be formulated by a matrix and a vector such that: wc 'From the theory of condition-limited least squares, the optimal fi lter that meets these constraints is: ai ”= aï ßllífhïëllcllwf -ifhfl This condition constraint is especially useful when it is known a priori that the channel has no frequency content in a certain frequency range .

Förstärknings- och formvillkorsbegränsningarna kan också kombineras. I ett sådant fall tillämpas företrädesvis formvillkorsbegränsningen först och förstärkningsvillkorsbegränsningen adderas sedan som en faktor enligt: E frame end Z ¿.w(n)z ' n=framesmr| här: = gchsn ge _: L. _.c7 Eftersom ñltren beror på det obegränsade filtret och det senare följer, eftersom cl(n)+ c2(n) = 2x(n) , relationen: hïïflfï =2<>U (1) där ö' betecknar identitetsfiltret. Användbara egenskaper kan härledas för de formvillkorsbegränsade filtren, om víllkorsbegränsningarna på de två kanalerna år identiska, 10 15 20 25 30 527 713 17 då hä? +11: = 26 Ja: m'¿=.;l1l'(.w-2lï.”lß)- Denna ekvation är användbar för bithastighetsreducering vid kodning av kanalfiltren, eftersom det visar sig att kanalfiltren är relaterade genom kvantiteter som finns tillgängliga på avkodarsidan.The reinforcement and shape condition restrictions can also be combined. In such a case, the shape condition limitation is preferably applied first and the reinforcement condition limitation is then added as a factor according to: E frame end Z ¿.w (n) z 'n = framesmr | here: = gchsn give _: L. _.c7 Since ñltren depends on the unlimited filter and the latter follows, since cl (n) + c2 (n) = 2x (n), the relation: hïï fl fï = 2 <> U (1 ) where ö 'denotes the identity filter. Useful properties can be deduced for the shape-condition-limited filters, if the will-cross-limitations on the two channels are identical, then 15? +11: = 26 Yes: m'¿ = .; l1l '(. W-2lï. ”Lß) - This equation is useful for bit rate reduction when coding the channel filters, as it turns out that the channel filters are related by quantities available on decoder side.

Relationen mellan de formvillkorsbegränsade filtrena öppnar även upp för en rationell beräkning av flltrena. I fig. 7 visar en illustration att en cl av två kanaler cl, c2 reproduceras genom att applicera monosignalen x på ett icke villkorsbegränsat ñlter 131. Resultatet från det icke villkorsbegränsade filtret modifieras beroende på forrnvillkorsbegränsningar i en formvillkors- begränsningssektion 132. Från det formvillkorsbegränsade filtret för cl- kanalen kan även det formvillkorsbegränsade filtret för kanal c2 beräknas och tillhandahållas till separata förstärkningsvillkorsbegränsningssektioner 133 för varje kanal.The relationship between the shape-constrained ävenltrene also opens up for a rational calculation of the flltrene. I fi g. 7 shows an illustration that a cl of two channels c1, c2 is reproduced by applying the mono signal x to a non-conditional filter 131. The result of the non-conditional filter is modified depending on the condition conditions in a shape condition limiting section 132. From the condition condition limited claw. channel, the shape condition limited filter for channel c2 can also be calculated and provided to separate gain condition limiting sections 133 for each channel.

Ett mer detaljerat blockdiagram för en annan utföringsforrn som använder en sidosignal för att applicera formvillkorsbegränsningen illustreras i fig. 8.A more detailed block diagram of another embodiment using a side signal to apply the shape condition constraint is illustrated in fi g. 8.

Två kanalsignaler c1 och cq kombineras i additionsorgan 55, 57 i en linjärkombinationsenhet 34 till en monosignal x och en sidosignal s. En kanalñltersektion 130 innefattar ett icke villkorsbegränsat parametriskt ñlter 131, vilket applicerat på monosignalen x reproducerar en skattning av sidosignalen š. I en icke villkorsbegränsad optimeringsenhet 33, anpassas ñlterkoefñcienterna för att ge den minsta skillnaden mellan s och š. Det ñlter som uppnås på detta sätt 13:” tillhandahålls till en forrnvillkors- begränsningssektion 132, i grunden enligt diskussionerna längre upp. Ett formvillkorsbegränsat ñlter 11:” för sidosignalen skapas. Från relationen (1) 10 15 20 25 30 527 713 18 mellan kanalñlter i en stereotillämpning beräknas ett formvillkorsbegränsat filter för varje kanalsignal, baserat på det formvillkorsbegränsade filtret Qi' för sidosignalen. Dessa filter, eller snarare deras koefficienter, tillhandahålls till en respektive förstärkningsvillkorsbegränsningssektion 13321, 133:2. En förstärkningsfaktor för varje kanalsignal beräknas och de två filtren tillhandahålls till en parameterkodningssektion 66, där de två ñltrens parametrar kodas tillsammans.Two channel signals c1 and cq are combined in addition means 55, 57 in a linear combining unit 34 into a mono signal x and a side signal s. In a non-conditional optimization unit 33, the intercoefficients are adjusted to give the smallest difference between s and š. What is achieved in this way 13: 'is provided to a pre-condition limitation section 132, basically according to the discussions further up. A shape condition limited ñlter 11: ”for the side signal is created. From the relationship (1) between channel filters in a stereo application, a shape condition limited filter for each channel signal is calculated, based on the shape condition limited filter Qi 'of the side signal. These filters, or rather their coefficients, are provided to a respective gain condition limitation section 13321, 133: 2. A gain for each channel signal is calculated and the two filters are provided to a parameter coding section 66, where the parameters of the two filters are coded together.

Efter beräkning av de villkorsbegränsade kanalñltren hd och IL, kvantiseras och kodas de till en representation, vilken är lärnplig för överföring till mottagaren. Typiskt sett kvantiseras ñltrens koefficienter genom användning av skalära eller vektorkvantiserare och kvantiserarindex överförs.After calculating the conditional channel channels hd and IL, they are quantized and coded to a representation, which is mandatory for transmission to the receiver. Typically, the coefficients of the filters are quantized using scalar or vector quantizers and the quantizer index is transmitted.

Kvantiserarna kan även implementera prediktion, vilket är mycket fördelaktigt för bithastighetsreduktion speciellt i detta scenarium.The quantizers can also implement prediction, which is very beneficial for bit rate reduction especially in this scenario.

Genom att använda filtrens komplementegenskaper för kan man ytterligare reducera bithastigheten eftersom endast ett av filtren hd eller 13,2 eller en linjär-kombination av dem kvantiseras och överförs medan förstärkningarna gu och gc, vektorkvantiseras tillsammans och överförs separat. En sådan överföring kan utföras vid bithastigheter så låga som t.ex. 1 kbps.By using the complement properties of the filters, one can further reduce the bit rate because only one of the filters hd or 13.2 or a linear combination of them is quantized and transmitted while the gains gu and gc are vector quantized together and transmitted separately. Such a transfer can be performed at bit rates as low as e.g. 1 kbps.

Mottagaren avkodar först den överförda monosignalen och de överförda kanalfiltrena. Sedan regenererar den de olika kanalsignalerna genom filtrering av monosignalen genom de respektive kanalfiltren. Företrädesvis används i stereofallet fullständighetsegenskapen och koefficienterna återkombineras för att producera filtren llc, och äcz.The receiver first decodes the transmitted mono signal and the transmitted channel filters. It then regenerates the various channel signals by filtering the mono signal through the respective channel filters. Preferably, in the stereo case, the completeness property is used and the coefficients are recombined to produce the filters llc, and äcz.

Vissa efterbearbetningssteg som ytterligare förbättrar den rekonstruerade multikanalssignalens kvalitet kan följa regenereringen av de olika kanalsignalerna. 10 15 20 25 30 527 713 19 Det är ibland till fördel att jämna ut förstärkningen för de formvillkors- begränsade filtren eller en linjärkombination av dessa filter innan beräkning av de förstärkningsvillkorsbegränsade kanalñltrena.Some post-processing steps that further improve the quality of the reconstructed multi-channel signal may follow the regeneration of the various channel signals. 10 15 20 25 30 527 713 19 It is sometimes advantageous to even out the gain of the shape-condition-limited filters or a linear combination of these filters before calculating the gain-condition-limited channel filters.

Till exempel, i fallet med stereo, är det ekvivalenta sidosignalsñltret (såsom används i fig. 8): ä? = O-Shf -0-51112 och för att minska möjliga artefakter jåmnas förstärkningsskillnaden för detta filter ut mellan på varandra följande ramar, vilket leder till ett filter [íf .For example, in the case of stereo, the equivalent side signal filter (as used in Fig. 8) is: ä? = O-Shf -0-51112 and to reduce possible artifacts, the gain difference of this filter is smoothed out between successive frames, leading to a filter [íf.

Kanalfiltren modifieras enligt: EÉ=ö+šf ~sc ~sc älrl = 6 _ ä: ' Denna typ av modifiering bevarar inte formvillkorsbegränsningarna men man kan emellertid lätt se att formvillkorsbegränsningar fortfarande bevaras på sidosignalsfiltret och detta är tillräckligt i fallet med stereokodning.The channel filters are modified according to: EÉ = ö + šf ~ sc ~ sc älrl = 6 _ ä: 'This type of modification does not preserve the shape condition constraints, but it can be easily seen that shape condition constraints are still preserved on the side signal filter and this is sufficient in the case of stereo coding.

Förstärkningsvillkorsbegränsningen på filtrena antar tidigare beräknade kanalenergier, dvs. ECPEÛ. Det är viktigt att styra ñltrens förstärkning, tex. gwgd och att undvika onödig förstärkning genom begränsning av förstårkningarna. Beroende på de olika kanalsignalernas egenskaper kan det inträffa att kanalerna är antikorrelerade över hela frekvensområdet eller i vissa frekvensband. Detta leder till en viss utsläckning när monokanalen bildas. I detta fall, eftersom den individuella kanalinformationen har förlorats, åtminstone delvis och i vissa frekvensband, är det ofta till fördel att begränsa kanalförstärkningarna när dessa är större än en viss storlek, tex.The gain condition limitation on the filters assumes previously calculated channel energies, ie. ECPEÛ. It is important to control the amplification of the ñltren, e.g. gwgd and to avoid unnecessary reinforcement by limiting the reinforcements. Depending on the characteristics of the different channel signals, it may happen that the channels are anti-correlated over the entire frequency range or in certain frequency bands. This leads to a certain extinction when the monochannel is formed. In this case, since the individual channel information has been lost, at least in part and in certain frequency bands, it is often advantageous to limit the channel gains when these are larger than a certain size, e.g.

O dB. Ett sätt att utföra denna förstärkningsbegränsning är att beräkna en viss förstärkningsfaktor: lO 15 20 25 30 5 2 7 7 1 3 lb 425092 = äcflny + Écflny n=0 gr vilken är kvoten mellan den effektiva monokanalsenergin och energin för monokanalen om de två kanalerna vore okorrelerade. När denna faktor är mindre än 0 dB har vi signalutsläckning. I detta fall kvantiserar g, hur allvarlig denna utsläckning Förstärkningsbegränsningen kan sedan beräknas som: gt] (dB) = max(gcl(dß)+ gpgzßlo), när g, < o dB .O dB. One way to perform this gain limitation is to calculate a certain gain factor: 10 15 20 25 30 5 2 7 7 1 3 lb 425092 = äc fl new + Éc fl new n = 0 gr which is the ratio between the effective mono-channel energy and the energy of the mono-channel if the two channels were uncorrelated. When this factor is less than 0 dB, we have signal extinction. In this case, g quantifies how severe this extinction is. The gain limitation can then be calculated as: gt] (dB) = max (gcl (dß) + gpgzßlo), when g, <o dB.

Samma begränsning gäller för förstärkningen för de andra kanalerna.The same limitation applies to the gain for the other channels.

Det är inte bara kanalfilterparainetrarna som behöver kodas och överföras, utan även monosignalen. Det finns två olika principangreppssätt för att beakta monosignalsljudkodning när kanalfilterkoefficienter härleds.It is not only the channel parameters that need to be coded and transmitted, but also the mono signal. There are two different principle approaches for considering mono-signal audio coding when deriving channel coefficients.

På ett sätt med öppen krets härleds filtren baserade på originalmonosignalen. Detta är t.ex. fallet i fig. 2a, där signalen 42 är originalrnonosignalen x. Avkodaren kommer emellertid att använda en kvantiserad monosignal som insignal för kanalfiltreringen.In an open circuit manner, the filters are derived based on the original mono signal. This is e.g. the case in Fig. 2a, where the signal 42 is the original mono signal x. However, the decoder will use a quantized mono signal as the input signal for the channel filtering.

På ett sätt med sluten krets baseras filterberäkningarna på den kodade och alltså redan kvantiserade monosignalen. Detta är t.ex. fallet i ñg. 3a, där signalen 44 är en avkodad monosignal x". Detta angreppssätt har fördelen att kanalfilterutformningen inte endast syftar till att passa ihop de respektive kanalsignalerna på bästa möjliga sätt. Den syftar även till att mildra kodningsfel, vilka är resultatet av monosignalskodningen.In a closed circuit manner, the filter calculations are based on the coded and thus already quantized mono signal. This is e.g. fallen in ñg. 3a, where the signal 44 is a decoded mono signal x ". This approach has the advantage that the channel filter design not only aims to match the respective channel signals in the best possible way. It also aims to alleviate coding errors which are the result of the mono signal coding.

Principerna som hittills har beskrivits kan tillämpas på hela spektrumet, dvs. fullbandssignaler. De är emellertid lika bra eller till och med mer fördelaktigt tillämpbara på delband av signalerna. Fig. 9 illustrerar 10 15 20 25 30 527 713 21 principerna för delbandsbearbetning. Ett antal kanaler c; - cN delas var och en in i K delband SBl, SB2, SBK. Kanalsignalerna i varje delband tillhandahålls till en respektive multikanalskodarenhet 80:l-80:K, där kanalsignalerna kodas. En eller flera av multikanalskodarenheterna 80:1- 80:K kan vara multikanalskodarenheter enligt den föreliggande uppfinningen. En bitströmskombinerare 82 kombinerar de kodade signalerna till en gemensam kodad signal 53, som överförs.The principles described so far can be applied to the whole spectrum, ie. full band signals. However, they are equally good or even more advantageously applicable to subbands of the signals. Fig. 9 illustrates the principles of subband processing. A number of channels c; - cN is each divided into K subbands SB1, SB2, SBK. The channel signals in each subband are provided to a respective multichannel encoder unit 80: 1-80: K, where the channel signals are encoded. One or more of the multichannel encoder units 80: 1-80: K may be multichannel encoder units according to the present invention. A bitstream combiner 82 combines the coded signals into a common coded signal 53, which is transmitted.

Fördelar med den beskrivna delbandsbearbetningen är att multikanals- kodning för de olika delbanden kan utföras individuellt, optimerat med avseende på t.ex. tilldelad bithastighet, bearbetningsramsstorlek och samplingstakt.Advantages of the described subband processing are that multi-channel coding for the different subbands can be performed individually, optimized with respect to e.g. assigned bit rate, machining frame size and sampling rate.

En speciell sort av delbandsbearbetning utför inte multikanalskodning för mycket låga frekvenser, t.ex. under 200 Hz. Detta betyder att för detta mycket låga frekvensband överförs en ren monosignal. Denna princip använder det faktum att den mänskliga stereouppfattningen är mindre känslig för mycket låga frekvenser. Det är känt från teknikens ståndpunkt och kallas subwooñng.A special type of subband processing does not perform multi-channel coding for very low frequencies, e.g. below 200 Hz. This means that for this very low frequency band a pure mono signal is transmitted. This principle uses the fact that the human stereo perception is less sensitive to very low frequencies. It is known from the state of the art and is called subwooñng.

I en ytterligare utföringsform av delbandsbearbetningen görs bandsplíttringen under användning av en tid-frekvens-transform såsom t.ex. en korttids-Fourier-transform (STFT), vilken tillåter uppdelning av signalen i enstaka frekvenskomponenter. I detta fall reduceras filtreringen till en ren multiplikation av monosignalens individuella spektrala koefñcienter med en komplex faktor.In a further embodiment of the subband processing, the band splitting is done using a time-frequency transform such as e.g. a short-term Fourier transform (STFT), which allows the signal to be divided into individual frequency components. In this case, the filtering is reduced to a pure multiplication of the individual spectral coefficients of the mono signal by a complex factor.

Det parametriska multikanalskodningsförfarandet enligt uppfinningen kommer typiskt sett att inbegripa fast ramvis bearbetning av signalsampel.The parametric multichannel coding method of the invention will typically involve fixed frame processing of signal samples.

Med andra ord hårleds parametrar som beskriver multikanalsbilden och överförs med en hastighet som motsvarar en kodningsramlängd av t.ex. 20 ms. Parametrarna kan emellertid erhållas från sígnalramar vilka är mycket större än kodningsramlängden. Ett lämpligt val är att sätta längden av 10 15 20 25 30 527 713 22 sådana analysramar till värden som är större än kodningsramens längd.In other words, parameters describing the multichannel image are wired and transmitted at a rate corresponding to a coding frame length of e.g. 20 ms. However, the parameters can be obtained from signal frames which are much larger than the coding frame length. A suitable choice is to set the length of such analysis frames to values greater than the length of the coding frame.

Detta medför att parameterberåkningen utförs med överlappande analysramar.This means that the parameter calculation is performed with overlapping analysis frames.

Detta illustreras i ñg. 10. Analysramar 83 vid kodaren är något längre än kodningsramar 84, såsom visas i övre delen av figuren. En konsekvens av sådana överlappande analysramar är att parametrarna utvecklas jämnt, vilket är väsentligt för att tillhandahålla ett stabilt intryck av multikanalsljudsignalerna. Samma sak utförs på avkodarsidan, vilket visas i mitten av figuren. Det är alltså väsentligt i avkodaren att ta hänsyn till detta och att bilda fönster och att lägga till överlapps till syntetiseringsramar 85, med ett överlapp 86, såsom visas i nedre delen av figuren. Detta möjliggör en jämn övergång mellan filter som associeras med varje ram. Även vid kodaren kan jämn filterparameterutveckling tvingas fram. Det är t.ex. möjligt att tillämpa lågpass- eller medianfiltrering på filterparametrarna.This is illustrated in ñg. 10. Analysis frames 83 at the encoder are slightly longer than coding frames 84, as shown in the upper part of the figure. One consequence of such overlapping analysis frames is that the parameters develop evenly, which is essential to provide a stable impression of the multi-channel audio signals. The same thing is done on the decoder side, which is shown in the middle of the figure. It is thus essential in the decoder to take this into account and to form windows and to add overlap to synthesizing frames 85, with an overlap 86, as shown in the lower part of the figure. This allows a smooth transition between filters associated with each frame. Even with the encoder, even filter parameter development can be forced. It is e.g. possible to apply low-pass or median filtering to the filter parameters.

Såväl monofona ljudkodekar som talkodekar enligt teknikens ståndpunkt utför så kallad brusformning av kodningsbruset. Syftet med denna operation är att flytta kodningsbruset till frekvenser där signalen har hög spektral densitet och alltså gör bruset mindre hörbart. Brusfonnning görs vanligtvis adaptivt, dvs. som svar på ljudsignalen. Detta medför att i allmänhet kommer brusformning utförd på monosignalen att vara olik den som fordras för de olika kanalsignalerna. Som ett resultat, trots passande brusformning i monoljudkodeken kan den efterföljande kanalfiltreringen enligt den föreliggande uppfinningen leda till en hörbar kodningsbrusökning i den rekonstruerade multikanalssignalen når den jämförs med det hörbara kodningsbruset i monosignalen.Both monophonic audio codecs and speech codecs according to the prior art perform so-called noise shaping of the coding noise. The purpose of this operation is to move the coding noise to frequencies where the signal has a high spectral density and thus makes the noise less audible. Noise formation is usually done adaptively, ie. in response to the audio signal. This means that in general noise formation performed on the mono signal will be different from that required for the different channel signals. As a result, despite appropriate noise formation in the mono audio codec, the subsequent channel filtering according to the present invention may lead to an audible coding noise increase in the reconstructed multi-channel signal when compared with the audible coding noise in the mono signal.

För att mildra detta problem kan signaladaptiv efterfiltrering tillämpas på de rekonstruerade kanalsignalerna i ett efterbearbetningssteg i mottagaren.To alleviate this problem, signal adaptive after filtering can be applied to the reconstructed channel signals in a post-processing step in the receiver.

Vilken efterfiltreringsteknik som helst enligt teknikens ståndpunkt kan 10 15 20 25 30 527 713 23 utnyttjas här, vilket väsentligen betonar spektrala toppar eller fördjupar spektrala dalar och därigenom reducerar det hörbara bruset. Ett exempel på en sådan teknik är så kallad högupplöst efterfiltrering, vilken beskrivs i det Europeiska patentet O 965 123 Bl av E. Ekudden et. al. Andra enkla förfaranden är så kallade "pitch- och formanfl-efterfilter, vilka är kända från talkodning.Any prior art filtering technique can be used here, which substantially emphasizes spectral peaks or deepens spectral valleys, thereby reducing audible noise. An example of such a technique is so-called high-resolution post-filtration, which is described in European patent 0 965 123 B1 by E. Ekudden et. al. Other simple methods are so-called "pitch and shape" after letters, which are known from speech coding.

I ñg. ll illustreras huvudstegen i en utföringsform av ett kodningsförfarande enligt den föreliggande uppñnningen som ett flödesdiagram. Proceduren börjar i steg 200. I steg 220 kodas en huvudsignal, företrädesvis en monosignal, som är härledd från multikanalssignalerna. I steg 222 optimeras ñlterkoefficienter för att ge en så bra representation som möjligt av en kanalsignal när de appliceras på huvudsignalen. Optimeringen äger rum under fömimmelsevillkorsbegränsningar. De optimala koefficienterna kodas sedan i steg 224. Proceduren slutar i steg 299.I ñg. 11, the main steps in an embodiment of a coding method according to the present invention are illustrated as a flow chart. The procedure begins in step 200. In step 220, a main signal, preferably a mono signal, which is derived from the multi-channel signals is encoded. In step 222, koltercoefficients are optimized to give as good a representation as possible of a channel signal when applied to the main signal. The optimization takes place under perceptual condition constraints. The optimal coefficients are then coded in step 224. The procedure ends in step 299.

Utföringsformerna beskrivna ovan ska förstås såsom några illustrativa exempel på den föreliggande uppfinningen. Det inses av fackmannen att olika modifieringar, kombinationer och ändringar kan göras på utföringsformerna utan att avlägsna sig från den föreliggande uppñnningens omfattning. I synnerhet kan olika dellösningar i de olika utföringsforrnerna kombineras till andra konfigurationer, där så är tekniskt möjligt. Den föreliggande uppñnningens omfattning definieras emellertid av de bifogade kraven.The embodiments described above are to be understood as illustrative examples of the present invention. It will be appreciated by those skilled in the art that various modifications, combinations and alterations may be made to the embodiments without departing from the scope of the present invention. In particular, different sub-solutions in the different embodiments can be combined into other configurations, where this is technically possible. However, the scope of the present invention is defined by the appended claims.

REFERENSER Amerikanskt patent US 5,285,498 Amerikanskt patent US 5,434,948 Europeiskt patent EP O 497 413 Europeiskt patent EP 0 965 123 527 715 24 "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, maj 2002, München, Tyskland av C.REFERENCES American patent US 5,285,498 American patent US 5,434,948 European patent EP 0 497 413 European patent EP 0 965 123 527 715 24 "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, May 2002, Munich, Germany by C.

Faller et al.Faller et al.

Claims (18)

l0 15 20 25 30 527 715 Q S' NYA PATENTKRAV 2004-01-01 PATENTKRAVl0 15 20 25 30 527 715 Q S 'NEW PATENT REQUIREMENTS 2004-01-01 PATENT REQUIREMENTS 1. Ett förfarande för kodning av multikanalssignaler (oi-CN) innefattande åtminstone en första och en andra kanal, innefattande stegen: generering av kodningsparametrar (px) som representerar en huvudsignal (x) som är en första förutbestämd linjärkombination av signaler från multikanalssignalerna (c1-cN); härledning av optimala parametrar (pi-pn) för ett första anpassningsbart filter (31; 131, 132, 133:1-2); och kodning av de optimala parametrarna [pi-pu), kännetecknat av det ytterligare steget: härledning av optimala parametrar (pi-pm) för åtminstone ett andra anpassningsbart filter (31, 131, 132, 133:1-2); vilket första anpassningsbara filter (3l; 131, 132, l33:1-2) hårleds för att ge en minimal skillnad mellan signalen för den första kanalen (ei-CN) och en filterutsignal när det första anpassningsbara ñltret (31; 131, 132, 13311-2) appliceras på den första förutbestämda línjärkombinatíonen (x); vilken minimal skillnad är definierad enligt ett första kriterium; vilket andra anpassningsbara filter (31; 131, 132, 133:1-2) härleds för att ge en minimal skillnad mellan signalen för den andra kanalen (Ci-CN) och en filterutsignal när det andra anpassningsbara filtret (31; 131, 132, 133: 1-2) appliceras på den första förutbestämda linjärkombinationen (x); vilken minimal skillnad är definierad enligt ett andra kriterium; varvid härledningsstegen för de första och andra anpassningsbara filtren (31, 131, 132, 133:1-2) utförs under åtminstone en förnimmelsevillkorsbegränsning vald från gruppen av förstärkningsvillkorsbegränsning och formvillkorsbegränsning.A method of encoding multichannel signals (oi-CN) comprising at least a first and a second channel, comprising the steps of: generating coding parameters (px) representing a main signal (x) which is a first predetermined linear combination of signals from the multichannel signals (c1). -cN); deriving optimal parameters (pi-pn) for a first adaptable filter (31; 131, 132, 133: 1-2); and encoding the optimal parameters [pi-pu), characterized by the further step: deriving optimal parameters (pi-pm) for at least a second adaptable filter (31, 131, 132, 133: 1-2); which first adaptable filter (31; 131, 132, 133: 1-2) is routed to provide a minimal difference between the signal for the first channel (ei-CN) and a filter output signal when the first adaptable filter (31; 131, 132) 13311-2) is applied to the first predetermined linear combination (x); what minimum difference is defined according to a first criterion; which second adaptable filter (31; 131, 132, 133: 1-2) is derived to give a minimal difference between the signal for the second channel (Ci-CN) and a filter output signal when the second adaptable filter (31; 131, 132, 133: 1-2) is applied to the first predetermined linear combination (x); which minimum difference is defined according to a second criterion; wherein the derivation steps of the first and second adaptable filters (31, 131, 132, 133: 1-2) are performed under at least one sensing condition constraint selected from the group of gain condition constraint and shape condition constraint. 2. Ett förfarande enligt krav 1, kännetecknat av att åtminstone ett av det första kriteriet och det andra kriteriet är ett minsta-kvadrat-kriterlum.A method according to claim 1, characterized in that at least one of the first criterion and the second criterion is a least squares criterion. 3. Ett förfarande enligt krav 1 eller 2, kännetecknat av att förnimmelsevillkorsbegränsningen år åtminstone en förstärkningsvillkors- 10 15 20 25 527 713 2 6 NYA PATENTKRAV 2004 -0 1 -O l begränsning, vilken strävar efter att ge en total energi för filterutsignalen som är lika med en total energi för den första kanalens signal.A method according to claim 1 or 2, characterized in that the perception condition limitation is at least one gain condition limitation, which strives to give a total energy for the utslter output signal which is equal to a total energy of the first channel signal. 4. Ett enligt krav 3, kännetecknat av att förstärkningsvillkorsbegränsningen är en absolut villkorsbegränsning, vilken förfarande kräver att den totala energin för filterutsignalen år lika med den totala energin för den motsvarande kanalens signal.One according to claim 3, characterized in that the gain condition limitation is an absolute condition limitation, which method requires that the total energy of the output signal is equal to the total energy of the signal of the corresponding channel. 5. Ett förfarande kännetecknat av att förstärkningsvillkorsbegränsningen år en mjuk villkorsbegränsning, vilken enligt krav 3, gynnar filter som ger den totala energin för ñlterutsignalen nära den totala energin för den motsvarande kanalens signalA method characterized in that the gain condition limitation is a soft condition limitation, which according to claim 3, favors filters which give the total energy of the inter-output signal close to the total energy of the signal of the corresponding channel 6. Ett förfarande enligt krav 3, kännetecknat av att förstärkningsvillkorsbegränsningen införs som en förstärkningsfaktor (ge, - gm) gånger ett anpassningsbart filter som härletts utan fórstärkningsvillkorsbegränsningar.A method according to claim 3, characterized in that the gain condition limitation is introduced as a gain factor (ge, - gm) times an adaptable filter derived without pre-reinforcement condition constraints. 7. Ett förfarande enligt krav 6, kännetecknat av att förstärkningsvillkorsbegänsningsfiltret hf ges av: f = gchf, E c m framzend ' 2 êw (ny n=framestart ge: där 11:” är det anpassningsbara filtret som härletts utan förstärkningsvillkors- begränsningar, EC en föreskriven energi för filterutsignalen och ê“°(n) är en filterutsignal för huvudsignal x(n) utan förstärkningsvillkorsbegränsningar. 10 15 20 25 30 527 713 2 P NYA PArENrxaAv 2004-01-01A method according to claim 6, characterized in that the gain condition limitation hf letter hf is given by: f = gchf, E cm forward '2 êw (new n = front start ge: where 11: "is the adaptable filter derived without gain condition constraints, EC a prescribed energy for the uts lter output signal and ê “° (n) is a filter output signal for main signal x (n) without amplification condition limitations 10 15 20 25 30 527 713 2 P NEW PARENTS OF 2004-01-01 8. Ett förfarande enligt något av kraven 1 till 7, kännetecknat av att förnimmelsevillkorsbegränsningen år åtminstone en formvillkorsbegränsning, vilken inför en fördefinierad spektralform på det anpassningsbara filtret (3l; 131, 132, 1334-2).A method according to any one of claims 1 to 7, characterized in that the perception condition limitation is at least one shape condition limitation, which introduces a predetermined spectral shape on the adaptable filter (31; 131, 132, 1334-2). 9. Ett förfarande enligt krav 8, kännetecknat av att formvillkors- begränsningen inför nollinnehåll i ett fördefinierat frekvensintervall.A method according to claim 8, characterized in that the shape condition limitation introduces zero content in a predetermined frequency range. 10. Ett förfarande enligt något av kraven l till 9, kännetecknat av att kodningssteget för de optimala parametrarna (pi-pn) innefattar samtidig kodning av de optimala parametrarna för de första och andra anpassningsbara filtren.A method according to any one of claims 1 to 9, characterized in that the coding step for the optimal parameters (pi-pn) comprises simultaneous coding of the optimal parameters for the first and second adaptable filters. 11. Ett förfarande enligt något av kravenl till 10 och enligt krav 8, kännetecknat av att härledningssteget för parametrarna i sin tur innefattar stegen: skapande av en andra förutbestämd linjärkombinatíon (s; c*1-c*N-1) av signalerna från multikanalssignalerna (c1-cN); härledning av parametrar för ett tredje ñlter för att ge en minimal skillnad mellan den andra förutbestämda linjårkombinationen och filterutsignalen när det tredje filtret appliceras på den första förutbestämda linjärkombinationen, under formvillkorsbegränsningen; beräkning av de optimala parametrarna för de första och andra filtren som en funktion av de optimala parametrarna för det tredje filtret.A method according to any one of claims 1 to 10 and characterized by claim 8, characterized in that the derivation step of the parameters in turn comprises the steps of: creating a second predetermined linear combination (s; c * 1-c * N-1) of the signals from the multichannel signals (c1-cN); deriving parameters for a third filter to provide a minimal difference between the second predetermined linear combination and the filter output when the third filter is applied to the first predetermined linear combination, below the shape condition limitation; calculation of the optimal parameters for the first and second filters as a function of the optimal parameters for the third filter. 12. Ett förfarande enligt något av kraven 1 till ll, kännetecknat av att hårledningssteget utförs baserat på de kodningsparametrar (px) som representerar huvudsignalen (x).A method according to any one of claims 1 to 11, characterized in that the hairline step is performed based on the coding parameters (px) representing the main signal (x). 13. Ett förfarande enligt något av kraven 1 till 11, kännetecknat av att härledningssteget utförs baserat direkt på den första förutbestämda linjärkombinationen (x). 10 15 20 25 30 527 713 J! NYA PATENTKRAV 2004-0 1 -0 1A method according to any one of claims 1 to 11, characterized in that the derivation step is performed based directly on the first predetermined linear combination (x). 10 15 20 25 30 527 713 J! NEW PATENT CLAIMS 2004-0 1 -0 1 14. Ett förfarande enligt något av kraven 1 till 13, kännetecknat av att multikanalssignalerna innefattar fler än två kanaler, varvid huvudsignalen baserar sig på en första förutbestämd linjärkombination (x) av alla de fler än två kanalerna, och signalen för varje kanal representeras av ett separat anpassningsbart filter, vilket är optimerat under förnimmelsevillkors- begränsningen.A method according to any one of claims 1 to 13, characterized in that the multi-channel signals comprise more than two channels, the main signal being based on a first predetermined linear combination (x) of all the more than two channels, and the signal for each channel is represented by a separately adaptable filter, which is optimized under the perception condition limitation. 15. Ett förfarande för avkodning av polyfoniska signaler som innefattar kodningsparametrar (px) som representerar en huvudsignal och kodade optimala parametrar för ett första anpassningsbart filter (öOzl-öOzN), innefattande stegen: avkodning av de kodningsparametrar (px) som representerar huvudsignalen; generering av en signal för en första kanal (c"1-c"N) genom applicering av det första anpassningsbara filtret (60:1-60:N) på den avkodade huvudsignalen (x"), kännetecknat av att kodningsparametrarna (px) vidare representerar kodade optimala parametrar för ett andra anpassningsbart filter (60: l-60:N); varvid förfarandet vidare innefattar steget generering av en signal för en andra kanal (c"1-c"N) genom applicering av det andra filtret (60:1-60:N) på den avkodade huvudsignalen (x"); vilka första och andra anpassningsbara ñlter (30: 1-30:N) är optímerade under åtminstone en förnirnmelsevillkorsbegränsning vald från gruppen av förstârkningsvillkorsbegränsning och formvillkorsbegränsning.A method of decoding polyphonic signals comprising coding parameters (px) representing a main signal and coded optimal parameters for a first customizable filter (öOzl-öOzN), comprising the steps of: decoding the coding parameters (px) representing the main signal; generating a signal for a first channel (c "1-c" N) by applying the first adjustable filter (60: 1-60: N) to the decoded main signal (x "), characterized in that the coding parameters (px) are further represents coded optimal parameters for a second adaptable filter (60: 1-60: N), the method further comprising the step of generating a signal for a second channel (c "1-c" N) by applying the second filter (60: 1-60: N) on the decoded main signal (x "); which first and second adaptable elements (30: 1-30: N) are optimized under at least one sensing condition constraint selected from the group of reinforcement condition constraint and shape condition constraint. 16. Ett förfarande enligt krav 15, kännetecknat av steget: generering av en signal för en andra kanal (c"1-c“N) som en förutbestämd linjärkombination av den avkodade huvudsignalen (x") och signalen för den första kanalen (c"1-c“N).A method according to claim 15, characterized by the step of: generating a signal for a second channel (c "1-c" N) as a predetermined linear combination of the decoded main signal (x ") and the signal for the first channel (c"). 1-c (N). 17. Kodníngsapparat (14), innefattande: lO 15 20 25 30 527 715 19 NYA PATENTKRAV 2004-0 l -0 l ingång (16:1-16:N) för multikanalssignaler (Ci-CN) som innefattar åtminstone en första och en andra kanal; organ (38) för generering av kodningsparametrar (px) som representerar en huvudsignal (x), vilken är en första förutbestämd linjärkombination av signaler från multikanalssignalerna (crcN), vilket organ (38) för generering är anslutet till ingången (16: l- l6:N); organ (3l; 131, 132, l33:1-2) för härledning av optimala parametrar för ett första anpassningsbart filter; organ (66) för kodning av de optimala parametrarna; och utgångsorgan (52); kännetecknar! av: organ (3l; 131, 132, l33:1-2) för härledning av optimala parametrar för ett andra anpassningsbart filter; vilket första anpassningsbart filter ger minimal skillnad mellan signalen för den första kanalen (c1-cN) och filterutsignalen när det första anpassningsbara filtret appliceras på den första förutbestämda linjärkombinationen (x); vilken minimal skillnad är definierad enligt ett första kriterium; vilket andra anpassningsbart filter ger minimal skillnad mellan signalen för den andra kanalen (cl-CN) och filterutsignalen när det andra anpassningsbara filtret appliceras på den första förutbestämda linjärkombinationen (x); vilken minimal skillnad är definierad enligt ett andra kriterium; varvid organet (3l; 131, 132, 13321-2) för härledning av de optimala parametrarna för de första och andra anpassningsbara filtren är anordnat för härledning av de optimala parametrarna under åtminstone en förnimmelsevillkorsbegränsning vald från gruppen av förstärkningsvillkors- begränsning och formvillkorsbegränsning.An encoding apparatus (14), comprising: 10 15 20 25 30 527 715 19 NEW CLAIMS 2004-0 1-0 1 input (16: 1-16: N) for multi-channel signals (Ci-CN) comprising at least a first and a second channel; means (38) for generating coding parameters (px) representing a main signal (x), which is a first predetermined linear combination of signals from the multichannel signals (crcN), which means (38) for generating is connected to the input (16: 1-6). : N); means (3l; 131, 132, 133: 1-2) for deriving optimal parameters for a first adaptable filter; means (66) for encoding the optimal parameters; and output means (52); characteristics! by: means (3l; 131, 132, 133: 1-2) for deriving optimal parameters for a second adaptable filter; which first adjustable filter gives minimal difference between the signal of the first channel (c1-cN) and the filter output signal when the first adjustable filter is applied to the first predetermined linear combination (x); what minimum difference is defined according to a first criterion; which second adjustable filter gives minimal difference between the signal of the second channel (cl-CN) and the filter output signal when the second adjustable filter is applied to the first predetermined linear combination (x); which minimum difference is defined according to a second criterion; wherein the means (31; 131, 132, 13321-2) for deriving the optimal parameters for the first and second adaptable filters is arranged for deriving the optimal parameters under at least one sensing condition limitation selected from the group of gain condition limitation and shape condition limitation. 18. Avkodningsapparat (24), innefattande: ingångsorgan (54) för kodningsparametrar (px) som representerar en huvudsignal (x) och kodade optimala parametrar för ett första anpassningsbart filter; 10 527 715 so NYA PATENTKRAV 2004 -0 l -0 1 organ (64) för avkodning av de kodningsparametrar (px) som representerar en huvudsignal (x); organ (60:1-60:N) för generering av signaler för en första kanal genom applicering av det första anpassningsbara filtret på den avkodade huvudsignalen (x"), kännetecknar! av att kodningsparametrania (px) vidare representerar kodade optimala parametrar för ett andra anpassningsbart filter; varvid avkodarapparaten vidare innefattar organ (60:1-60:N) för generering av signaler för en andra kanal genom applicering av det andra anpassningsbara filtret på den avkodade huvudsignalen (x"); vilka första och andra filter är optimerade under åtminstone en förnimmelsevillkorsbegränsning vald från gruppen av förstärkningsvillkors- begränsning och forrnvillkorsbegränsning.A decoding apparatus (24), comprising: input means (54) for coding parameters (px) representing a main signal (x) and coded optimal parameters for a first adaptable filter; NEW PATENT CLAIMS 2004 -0 l -0 1 means (64) for decoding the coding parameters (px) representing a main signal (x); means (60: 1-60: N) for generating signals for a first channel by applying the first adaptable filter to the decoded main signal (x "), characterized in that the coding parameters (px) further represent coded optimal parameters for a second adjustable filter, the decoder apparatus further comprising means (60: 1-60: N) for generating signals for a second channel by applying the second adjustable filter to the decoded main signal (x "); which first and second filters are optimized under at least one perceptual condition constraint selected from the group of gain condition constraint and pre-condition constraint.
SE0400415A 2003-12-19 2004-02-20 Coding of polyphonic signals with conditional filters SE527713C2 (en)

Priority Applications (10)

Application Number Priority Date Filing Date Title
SE0400415A SE527713C2 (en) 2003-12-19 2004-02-20 Coding of polyphonic signals with conditional filters
PL04809080T PL1639580T3 (en) 2003-12-19 2004-12-15 Coding of multi-channel signals
EP12154099A EP2456236A1 (en) 2003-12-19 2004-12-15 Constrained filter encoding of polyphonic signals
PCT/SE2004/001907 WO2005059901A1 (en) 2003-12-19 2004-12-15 Constrained filter encoding of polyphonic signals
EP04809080.7A EP1639580B1 (en) 2003-12-19 2004-12-15 Coding of multi-channel signals
PT48090807T PT1639580E (en) 2003-12-19 2004-12-15 Coding of multi-channel signals
ES04809080.7T ES2439693T3 (en) 2003-12-19 2004-12-15 Multi-channel signal encoding
DK04809080.7T DK1639580T3 (en) 2003-12-19 2004-12-15 Multichannel coding
JP2006518597A JP4323520B2 (en) 2003-12-19 2004-12-15 Constrained filter coding of polyphonic signals
US11/011,764 US7725324B2 (en) 2003-12-19 2004-12-15 Constrained filter encoding of polyphonic signals

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0303499A SE0303499D0 (en) 2003-12-19 2003-12-19 Multi-channel coding using gain-shape constrained filters
SE0400415A SE527713C2 (en) 2003-12-19 2004-02-20 Coding of polyphonic signals with conditional filters

Publications (3)

Publication Number Publication Date
SE0400415D0 SE0400415D0 (en) 2004-02-20
SE0400415L SE0400415L (en) 2005-06-20
SE527713C2 true SE527713C2 (en) 2006-05-23

Family

ID=31996352

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0400415A SE527713C2 (en) 2003-12-19 2004-02-20 Coding of polyphonic signals with conditional filters

Country Status (8)

Country Link
EP (2) EP2456236A1 (en)
JP (1) JP4323520B2 (en)
DK (1) DK1639580T3 (en)
ES (1) ES2439693T3 (en)
PL (1) PL1639580T3 (en)
PT (1) PT1639580E (en)
SE (1) SE527713C2 (en)
WO (1) WO2005059901A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2008016098A1 (en) * 2006-08-04 2009-12-24 パナソニック株式会社 Stereo speech coding apparatus, stereo speech decoding apparatus, and methods thereof
WO2010042024A1 (en) * 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (en) 1991-02-01 1992-09-01 Philips Nv SUBBAND CODING DEVICE, AND A TRANSMITTER EQUIPPED WITH THE CODING DEVICE.
US5285498A (en) 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
SE9700772D0 (en) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
WO2003009206A1 (en) * 2001-07-19 2003-01-30 Sungwoo Kim The system and operational method of mobile telecommunication device for electronic cash
WO2003009208A1 (en) * 2001-07-20 2003-01-30 Medical Research Group Method and apparatus for communicating between an ambulatory medical device and a control device via telemetry using randomized data
ATE354161T1 (en) 2002-04-22 2007-03-15 Koninkl Philips Electronics Nv SIGNAL SYNTHESIS

Also Published As

Publication number Publication date
EP2456236A1 (en) 2012-05-23
SE0400415L (en) 2005-06-20
DK1639580T3 (en) 2014-01-13
JP4323520B2 (en) 2009-09-02
ES2439693T3 (en) 2014-01-24
WO2005059901A1 (en) 2005-06-30
PT1639580E (en) 2013-11-19
SE0400415D0 (en) 2004-02-20
JP2007527543A (en) 2007-09-27
EP1639580A1 (en) 2006-03-29
PL1639580T3 (en) 2014-04-30
EP1639580B1 (en) 2013-10-23

Similar Documents

Publication Publication Date Title
KR102230727B1 (en) Apparatus and method for encoding or decoding a multichannel signal using a wideband alignment parameter and a plurality of narrowband alignment parameters
CN104851427B (en) Decoding system and coding/decoding method
CN107430863B (en) Audio encoder for encoding and audio decoder for decoding
EP2981956B1 (en) Audio processing system
KR101183857B1 (en) Method and apparatus to encode and decode multi-channel audio signals
TWI466106B (en) Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
US9666198B2 (en) Reconstruction of audio scenes from a downmix
KR101178060B1 (en) Multichannel Decorrelation in Spatial Audio Coding
US8249883B2 (en) Channel extension coding for multi-channel source
TWI544479B (en) Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program usin
JP5215994B2 (en) Method and apparatus for lossless encoding of an original signal using a loss-encoded data sequence and a lossless extended data sequence
EP1851759A1 (en) Improved filter smoothing in multi-channel audio encoding and/or decoding
KR20120006010A (en) Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
CN110223701B (en) Decoder and method for generating an audio output signal from a downmix signal
CN110998721B (en) Apparatus for encoding or decoding an encoded multi-channel signal using a filler signal generated by a wideband filter
US7725324B2 (en) Constrained filter encoding of polyphonic signals
JP2019506633A (en) Apparatus and method for MDCT M / S stereo with comprehensive ILD with improved mid / side decision
SE527713C2 (en) Coding of polyphonic signals with conditional filters
AU2018200340A1 (en) Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding