SE527670C2 - Natural fidelity optimized coding with variable frame length - Google Patents

Natural fidelity optimized coding with variable frame length

Info

Publication number
SE527670C2
SE527670C2 SE0400417A SE0400417A SE527670C2 SE 527670 C2 SE527670 C2 SE 527670C2 SE 0400417 A SE0400417 A SE 0400417A SE 0400417 A SE0400417 A SE 0400417A SE 527670 C2 SE527670 C2 SE 527670C2
Authority
SE
Sweden
Prior art keywords
coding
signal
subframes
side signal
signals
Prior art date
Application number
SE0400417A
Other languages
Swedish (sv)
Other versions
SE0400417L (en
SE0400417D0 (en
Inventor
Ingemar Johansson
Anisse Taleb
Stefan Bruhn
Daniel Enstroem
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303501A external-priority patent/SE0303501D0/en
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE0400417A priority Critical patent/SE527670C2/en
Publication of SE0400417D0 publication Critical patent/SE0400417D0/en
Priority to DE602004008613T priority patent/DE602004008613T2/en
Priority to AT07109801T priority patent/ATE443317T1/en
Priority to DE602004023240T priority patent/DE602004023240D1/en
Priority to BRPI0419281-8A priority patent/BRPI0419281B1/en
Priority to BRPI0410856A priority patent/BRPI0410856B8/en
Priority to AT04820553T priority patent/ATE371924T1/en
Priority to RU2005134365/09A priority patent/RU2305870C2/en
Priority to CN200710138487XA priority patent/CN101118747B/en
Priority to CA2527971A priority patent/CA2527971C/en
Priority to EP04820553A priority patent/EP1623411B1/en
Priority to PL04820553T priority patent/PL1623411T3/en
Priority to EP07109801A priority patent/EP1845519B1/en
Priority to JP2006518596A priority patent/JP4335917B2/en
Priority to AU2004298708A priority patent/AU2004298708B2/en
Priority to ZA200508980A priority patent/ZA200508980B/en
Priority to CNB2004800186630A priority patent/CN100559465C/en
Priority to CA2690885A priority patent/CA2690885C/en
Priority to US11/011,765 priority patent/US7809579B2/en
Priority to MXPA05012230A priority patent/MXPA05012230A/en
Priority to PCT/SE2004/001867 priority patent/WO2005059899A1/en
Publication of SE0400417L publication Critical patent/SE0400417L/en
Publication of SE527670C2 publication Critical patent/SE527670C2/en
Priority to HK08106066.8A priority patent/HK1115665A1/en
Priority to HK06112026.7A priority patent/HK1091585A1/en
Priority to RU2007121143/09A priority patent/RU2425340C2/en
Priority to JP2007216374A priority patent/JP4589366B2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Endoscopes (AREA)

Abstract

A method of encoding multi-channel audio signals comprises generating of a first output signal (x' mono ), being encoding (38) parameters representing a main signal (x mono ). The main signal (x mono ) is a first linear combination (34) of signals (16A,16B) of at least a first and a second channel. The method further comprises generating (30) of a second output signal (p side ), being encoding parameters representing a side signal (x side ). The side signal (x side ) is a second linear combination (36) of signals (16A,16B) of at least the first and the second channel within an encoding frame. The method is characterised in that the generating of the second output signal further comprises scaling of the side signal (x side ) to an energy contour of the main signal (x mono ). A method of decoding is also presented as well as an encoder, a decoder and audio system, all according to the same basic idea.

Description

20 25 30 527 670 2 bearbetas signalerna för de olika kanalerna tillsammans, snarare än separat och individuellt. De två mest allmänt använda samstereokodningsteknikerna är kända som "Mitten/Sida“-stereokodning (M / S) (eng. Mid/ Side) och intensitetsstereokodning, vilket normalt tillämpas på delband av de stereo- eller multikanalssignaler som ska kodas. The signals for the different channels are processed together, rather than separately and individually. The two most commonly used co-stereo coding techniques are known as "Mid / Side" stereo coding (M / S) and intensity stereo coding, which are normally applied to subbands of the stereo or multi-channel signals to be coded.

M/S-stereokodning liknar den beskrivna proceduren i stereo-FM-radio, på det sättet att den kodar och överför summa- och differenssignalerna för kanalemas delband och därigenom utnyttjar redundans mellan kanalernas delband. Strukturen och driften för en kodare som baserar sig på M/ S- stereokodning beskrivs t.ex. i det amerikanska patentet US 5,285,498 av J.D. Johnston.M / S stereo coding is similar to the procedure described in stereo FM radio, in that it encodes and transmits the sum and difference signals for the subbands of the channels and thereby utilizes redundancy between the subbands of the channels. The structure and operation of an encoder based on M / S stereo coding is described e.g. in U.S. Patent No. 5,285,498 to J.D. Johnston.

Intensitetsstereo å andra sidan klarar av att använda brist på stereo- samband. Den överför den gemensamma intensiteten för kanalerna (i de olika delbanden) tillsammans med någon positionsinformation som indikerar hur intensiteten fördelas mellan kanalerna. Intensitetsstereo tillhandahåller endast information om kanalernas spektrala magnitud. Fasinformation transporteras inte. Av denna orsak och eftersom den tídsrelaterade interkanalinformationen (mer specifikt tidsskillnaden mellan kanalerna) är av stor psykoakustisk relevans särskilt vid lägre frekvenser kan intensitetsstereo endast användas vid höga frekvenser över t.ex. 2 kHz. Ett intensitetskodningsförfarande beskrivs t.ex. i det europeiska patentet EPO4974l3 av R. Veldhuis et al.Intensity stereo, on the other hand, can handle the lack of stereo connections. It transmits the common intensity of the channels (in the different subbands) together with some position information indicating how the intensity is distributed between the channels. Intensity stereo only provides information about the spectral magnitude of the channels. Phase information is not transported. For this reason and since the time-related interchannel information (more specifically the time difference between the channels) is of great psychoacoustic relevance especially at lower frequencies, intensity stereo can only be used at high frequencies above e.g. 2 kHz. An intensity coding method is described e.g. in the European patent EPO497413 by R. Veldhuis et al.

Ett nyligen utvecklat stereokodningsförfarande beskrivs t.ex. i en konferensartikel med titeln "Binaural cue coding applied to stereo and multi- channel audio compression", 112th AES convention, maj 2002, München, Tyskland av C. Faller et al. Detta förfarande är ett parametriskt ljudkodningsförfarande för multikanaler. Den grundläggande principen är att kombinera ingångssignalerna från N kanaler ci, cg, cN till en monosignal m på kodningssidan. Monosignalen ljudkodas genom användning av någon konventionell monoljudkodek. Parallellt därmed 10 15 20, 25 30 ~ 527 67Û 3 härleds parametrar från kanalsignalerna, vilka beskriver multikanalsbilden.A recently developed stereo coding method is described e.g. in a conference paper entitled "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, May 2002, Munich, Germany by C. Faller et al. This method is a parametric audio coding method for multichannels. The basic principle is to combine the input signals from N channels ci, cg, cN to a mono signal m on the coding side. The mono signal is audio coded using any conventional mono audio codec. In parallel with this, parameters are derived from the channel signals, which describe the multi-channel image.

Parametrarna kodas och överförs till avkodaren, tillsammans med ljudbitströmmen. Avkodaren avkodar först monosignalen m' och regenererar sedan kanalsígnalerna ef, c2',..., cN', baserat på den parametriska beskrivningen av multikanalsbilden.The parameters are encoded and transmitted to the decoder, together with the audio bitstream. The decoder first decodes the mono signal m 'and then regenerates the channel signals ef, c2', ..., cN ', based on the parametric description of the multichannel image.

Principen för förfarandet med binaural inpassningskodning (BCC, eng.The principle of the binaural fit coding procedure (BCC, eng.

"Binaural Cue Coding") är att den överför den kodade monosignalen och så kallade kodade nivåskillnader mellan kanalerna och tidsskillnader mellan kanalerna för BCC-parametrar. BCC-parametrarna innefattar delband av den ursprungliga ingångssignalen med flera kanaler. Avkodaren regenererar de olika kanalsignalerna genom att applicera nivå- och fasanpassningar för varje delband av monosígnalen, baserat på BCC- parametrarna. Fördelen över t.ex. M/ S- eller intensitetsstereo är att stereoinformation som innefattar tidsrelaterad interkanalinformation överförs med mycket lägre bithastigheter. Denna teknik fordrar emellertid beräkningskrävande tid-frekvens-transfonner för var och en av kanalerna, både vid kodaren och vid avkodaren."Binaural Cue Coding") is that it transmits the coded mono signal and so-called coded level differences between the channels and time differences between the channels for BCC parameters. The BCC parameters include subbands of the original multi-channel input signal. The decoder regenerates the different channel signals by applying level and phase adjustments for each subband of the mono signal, based on the BCC parameters. The advantage over e.g. M / S or intensity stereo is that stereo information that includes time-related interchannel information is transmitted at much lower bit rates. However, this technique requires computationally demanding time-frequency transformers for each of the channels, both at the encoder and at the decoder.

Vidare hanterar BCC inte det faktum att mycket av stereoinforrnationen, speciellt vid låga frekvenser, är diffus, dvs. den kommer inte från någon speciell riktning. Diffusa ljudfålt finns i båda kanalerna av en stereoupptagning men de är till stor del ur fas i förhållande till varandra. Om en algoritm såsom BCC utsätts för upptagningar med en stor del diffusa ljudfålt, kommer den återskapade stereobilden bli förvirrad och hoppa från vänster till höger eftersom BCC-algoritmen endast kan rikta signalen i specifika frekvensband till höger eller vänster.Furthermore, BCC does not handle the fact that much of the stereo information, especially at low frequencies, is diffuse, ie. it does not come from any particular direction. Diffuse sound fields are present in both channels of a stereo recording, but they are largely out of phase in relation to each other. If an algorithm such as BCC is subjected to recordings with a large number of diffuse sound fields, the reproduced stereo image will be confused and jump from left to right because the BCC algorithm can only direct the signal in specific frequency bands to the right or left.

Ett möjligt medel för att koda stereosignalen och tillförsäkra en bra reproduktion av diffusa ljudfålt är att använda ett kodningsscherna som är mycket likt den teknik som används i rundsändning av FM stereoradio, nämligen att koda monosignalen (vänster+höger) och skillnadssignalen (vänster-höger) separat. 10 15 20 25 30 527 670 En teknik, beskriven i det amerikanska patentet US 5,434,948 av C.E. Holt et al., använder en liknande teknik som i BCC för att koda monosignalen och sidoinformation. I detta fall består sidoinformationen av prediktorfilter och eventuellt en restsignal. Prediktorfiltren, skattade genom en minsta- kvadrat-algoritm möjliggör, när de appliceras på monosignalen, prediktion av ljudsignaler med flera kanaler. Med denna teknik kan man nå kodning med mycket låg bithastíghet av ljudkällor med flera kanaler, emellertid på bekostnad av en kvalitetsförsämring, vilken diskuteras vidare nedan.A possible means of coding the stereo signal and ensuring a good reproduction of diffuse sound fields is to use a coding scheme which is very similar to the technology used in broadcasting FM stereo radio, namely to encode the mono signal (left + right) and the difference signal (left-right) separate. 527 670 A technique, described in U.S. Patent No. 5,434,948 to C.E. Holt et al., Use a similar technique as in BCC to encode the mono signal and side information. In this case, the side information consists of predictors or possibly a residual signal. The predictor filters, estimated by a least squares algorithm, when applied to the mono signal, enable the prediction of multi-channel audio signals. With this technology, very low bit rate encoding of multi-channel audio sources can be achieved, however, at the expense of a quality degradation, which is discussed further below.

Slutligen, för fullständighetens skull, måste en teknik som används i 3D-ljud nämnas. Denna teknik syntetiserar de högra och vänstra kanalsignalerna genom filtrering av ljudkällesignaler med så kallade huvudrelaterade ñlter.Finally, for the sake of completeness, a technology used in 3D audio must be mentioned. This technique synthesizes the right and left channel signals by filtering audio source signals with so-called main-related filters.

Denna teknik fordrar emellertid att de olika ljudkällesignalerna är separerade och kan alltså inte allmänt tillämpas för stereo- eller multikanalskodning.However, this technology requires that the various audio source signals be separated and thus not generally applicable to stereo or multi-channel coding.

SAMMANFATTNING Ett problem med existerande kodningsscheman baserade på kodning av signalramar, i synnerhet en huvudsignal och en eller flera sidosignaler, är att uppdelningen av ljudinformation i ramar kan introducera oattraktiva perceptionsartefakter. Att dela upp informationen i ramar av relativt lång varaktighet minskar allmänt den genomsnittliga fordrade bithastigheten.SUMMARY A problem with existing coding schemes based on coding of signal frames, in particular a main signal and one or fl your side signals, is that the division of audio information into frames can introduce unattractive perception artifacts. Dividing the information into frames of relatively long duration generally reduces the average required bit rate.

Detta kan vara fördelaktigt, t.ex. för musik som innehåller en stor mängd diffust ljud. För transientrik musik eller tal kommer emellertid de snabba tidsvariationerna att smetas ut över ramens varaktighet, vilket ger upphov till spöklika ljud eller till och med för-eko-problem. Att koda korta ramar kommer istället att ge en mer noggrann representation av ljudet, vilket minimerar energin, men fordrar högre överföringsbithastígheter och större beräkningsresurser. Kodningseffektiviteten som sådan kan alltså minska med mycket korta ramlängder. Införandet av fler ramgränser kan också 10 15 20 25 30 527 670 5 introducera diskontinuiteter i kodningsparametrar, vilket kan uppträda som perceptionsartefakter.This can be advantageous, e.g. for music that contains a large amount of diffused sound. For transient-rich music or speech, however, the rapid time variations will be smeared over the duration of the frame, giving rise to spooky sounds or even pre-echo problems. Coding short frames will instead provide a more accurate representation of the sound, which minimizes energy, but requires higher transmission bit rates and greater computational resources. The coding efficiency as such can thus decrease with very short frame lengths. The introduction of more frame boundaries can also introduce discontinuities in coding parameters, which can appear as perception artifacts.

Ett ytterligare problem med scheman baserade på kodning av en huvudsignal och en eller flera sídosignaler är att de ofta fordrar relativt stora beräkningsresurser. I synnerhet när korta ramar används är hantering av diskontinuiteter i parametrar från en ram till en annan en komplicerad uppgift. När långa ramar används kan skattningsfel för transienta ljud orsaka mycket stora sidosignaler, vilket i sin tur ökar kravet på överföringshastighet.A further problem with schemes based on encoding a main signal and one or more side signals is that they often require relatively large computational resources. Especially when short frames are used, handling discontinuities in parameters from one frame to another is a complicated task. When long frames are used, estimation errors for transient sounds can cause very large side signals, which in turn increases the requirement for transmission speed.

Ett syfte med den föreliggande uppfinningen är därför att tillhandahålla ett kodningsförfarande och en kodningsanordning som förbättrar Perceptions- kvaliteten för ljudsignaler med flera kanaler, i synnerhet för att undvika artefakter såsom för-ekande, spökliknande ljud eller ramdiskontinuitets- artefakter. Ett ytterligare syfte med den föreliggande uppfinningen är att tillhandahålla ett kodningsförfarande och en kodningsanordning som fordrar mindre processkraft och som har mer konstanta bithastighetsbehov vid överföring.An object of the present invention is therefore to provide an encoding method and an encoding device which improves the Perceptual quality of multi-channel audio signals, in particular to avoid artifacts such as squeaking, ghost-like sounds or frame discontinuity artifacts. A further object of the present invention is to provide a coding method and a coding device which requires less processing power and which has more constant bit rate requirements during transmission.

De ovanstående syftena åstadkoms med förfaranden och anordningar enligt de bifogade patentkraven. I allmänna ordalag används polyfona signaler för att skapa en huvudsignal, typiskt sett en monosignal, och en sidosignal.The above objects are achieved by methods and devices according to the appended claims. In general terms, polyphonic signals are used to create a main signal, typically a mono signal, and a side signal.

Huvudsignalen kodas enligt kodningsprinciper enligt teknikens ståndpunkt.The main signal is encoded according to coding principles according to the prior art.

Ett antal kodningsscheman för sidosignalen tillhandahålls. Varje kodningsschema kännetecknas av en uppsättning delramar av olika längder.A number of coding schemes for the side signal are provided. Each coding scheme is characterized by a set of subframes of different lengths.

Delramarnas totala längd motsvarar längden för kodningsschemats kodningsram. Uppsättningarna av delramar innefattar åtminstone en delram. Det kodningsschema som ska användas på sidosignalen väljs åtminstone delvis beroende på de polyfona signalernas aktuella signal- innehåll. 10 15 20 25 30 527 670 6 I en utföringsform äger valet rum antingen före kodningen, baserat på signalkarakteristikanalys. I en annan utföringsform kodas sidosignalen med vart och ett av kodningsschemana, och baserat på mätningar av kodningens kvalitet väljs det bästa kodningsschemat.The total length of the subframes corresponds to the length of the coding frame of the coding scheme. The sets of subframes include at least one subframe. The coding scheme to be used on the side signal is selected at least in part depending on the current signal content of the polyphonic signals. In one embodiment, the selection takes place either before the coding, based on signal characteristic analysis. In another embodiment, the side signal is encoded with each of the encoding schemes, and based on measurements of the encoding quality, the best encoding scheme is selected.

I en föredragen utföringsform skapas en restsidosignal såsom skillnaden mellan sidosignalen och huvudsignalen skalad med en balansfaktor.In a preferred embodiment, a residual side signal is created such as the difference between the side signal and the main signal scaled by a balance factor.

Balansfaktorn väljs för att minimera restsidosignalen. Den optimerade restsidosignalen och balansfaktorn kodas och tillhandahålls som parametrar som representerar sidosígnalen. På avkodarsidan används balansfaktorn, restsidosignalen och huvudsignalen för att återställa sidosignalen.The balance factor is selected to minimize the residual side signal. The optimized residual side signal and the balance factor are coded and provided as parameters representing the side signal. On the decoder side, the balance factor, the residual side signal and the main signal are used to reset the side signal.

I en vidare föredragen utföringsform innefattar sidosignalens kodning en energikonturskalníng för att undvika för-eko-effekter. Vidare kan olika kodningsscheman innefatta olika kodningsprocedurer i de separata delramarna.In a further preferred embodiment, the coding of the side signal comprises an energy contour scaling to avoid pre-echo effects. Furthermore, different coding schemes may include different coding procedures in the separate subframes.

Huvudfördelen med den föreliggande uppfinningen är att bibehållandet av ljudsignalernas perception förbättras. Vidare tillåter den föreliggande uppfinningen fortfarande överföring av multikanalsignaler vid mycket låga bithastigheter.The main advantage of the present invention is that the maintenance of the perception of the audio signals is improved. Furthermore, the present invention still allows the transmission of multichannel signals at very low bit rates.

KORT FIGURBESKRIVNING Uppfinningen, tillsammans med ytterligare syften och fördelar därmed, kan bäst förstås genom hänvisning till den följande beskrivningen ord tillsammans med de medföljande ritningarna, i vilka: FIG. 1 är ett blockschema över ett system för överföring av polyfona signaler; FIG. 2a är ett blockdiagrarn av en kodare i en sändare; FIG. 2b är ett blockdiagram för en avkodare i en mottagare; FIG. 3a är ett diagram som illustrerar kodningsramar av olika längder; 10 15 20 25 30 527 670 7 FIG. 3b och 3c är blockdiagram av utföringsformer av sidosignalkodar- enheter enligt den föreliggande uppfinningen; FIG. 4 är ett blockdiagram av en utföringsform av en kodare som använder balansfaktorskodning av sídosignalen; FIG. 5 är ett blockdiagram av en utföringsform av en kodare för multisignalssystem; FIG. 6 är ett blockdiagram av en utföringsform av en avkodare som är lämplig för avkodning av signaler från anordningen i fig. 5; FIG. 7a och b är diagram som illustrerar en för-eko-artefakt; FIG. 8 är ett blockdiagram av en utföringsform av en sidosignalskodar- enhet enligt den föreliggande uppfinningen, vilken använder olika kodningsprinciper i olika delramar; FIG. 9 illustrerar användningen av olika kodningsprinciper i olika frekvensdelband; FIG. 10 är ett flödesdiagram över de grundläggande stegen i en utföringsform av ett kodningsförfarande enligt den föreliggande uppfinningen; samt FIG. 11 är ett flödesdiagram över de grundläggande stegen i en utföringsform av ett avkodningsförfarande enligt den föreliggande uppfinningen.BRIEF DESCRIPTION OF THE DRAWINGS The invention, together with further objects and advantages thereof, may best be understood by reference to the following description of words taken in conjunction with the accompanying drawings, in which: FIG. 1 is a block diagram of a polyphonic signal transmission system; FIG. 2a is a block diagram of an encoder in a transmitter; FIG. 2b is a block diagram of a decoder in a receiver; FIG. 3a is a diagram illustrating coding frames of different lengths; 10 15 20 25 30 527 670 7 FIG. 3b and 3c are block diagrams of embodiments of side signal encoder units according to the present invention; FIG. 4 is a block diagram of an embodiment of an encoder using balance factor coding of the side signal; FIG. 5 is a block diagram of an embodiment of a multisignal system encoder; FIG. Fig. 6 is a block diagram of an embodiment of a decoder suitable for decoding signals from the device of Fig. 5; FIG. 7a and b are diagrams illustrating a pre-eco-artifact; FIG. 8 is a block diagram of an embodiment of a side signal encoder unit according to the present invention, which uses different coding principles in different subframes; FIG. 9 illustrates the use of different coding principles in different frequency subbands; FIG. 10 is a flow chart of the basic steps of an embodiment of a coding method according to the present invention; and FIG. 11 is a fate diagram of the basic steps in an embodiment of a decoding method according to the present invention.

DETALJERAD BESKRIVNING Fig. 1 illustrerar ett typiskt system 1, i vilket den föreliggande uppfinningen med fördel kan utnyttjas. En sändare 10 innefattar en antenn 12 som inbegriper tillhörande maskinvara och programvara för att kunna sända radiosignaler 5 till en mottagare 20. Sändaren 10 innefattar bland andra delar en multikanalskodare 14, vilken omvandlar signaler för ett antal ingängskanaler 16 till utgångssignaler som är lämpade för radiosändning.DETAILED DESCRIPTION Fig. 1 illustrates a typical system 1, in which the present invention can be used to advantage. A transmitter 10 includes an antenna 12 which includes associated hardware and software for transmitting radio signals 5 to a receiver 20. The transmitter 10 includes, among other parts, a multi-channel encoder 14 which converts signals for a plurality of input channels 16 into output signals suitable for radio transmission.

Exempel på lämpliga multikanalskodare 14 beskrivs i detalj längre ner.Examples of suitable multi-channel encoders 14 are described in detail below.

Ingångskanalernas 16 signaler kan tillhandahållas från t.ex. en ljudsignalslagring 18, såsom en datañl med digital representation av ljudupptagníngar, magnetbands- eller vinylskiveinspelningar av ljud etc. 10 15 20 25 30 527 670 8 Ingångskanalernas 16 signaler kan även tillhandahållas "levande", t.ex. från en uppsättning mikrofoner 19. Ljudsignalerna digitaliseras, om de inte redan är i digital form, innan de kommer in i multikanalskodaren 14.The signals of the input channels 16 can be provided from e.g. an audio signal storage 18, such as a data cell with digital representation of audio recordings, magnetic tape or vinyl record recordings of sounds, etc. The signals of the input channels 16 can also be provided "live", e.g. from a set of microphones 19. The audio signals, if not already in digital form, are digitized before entering the multi-channel encoder 14.

Vid mottagarsidan 20, hanterar en antenn 22 med tillhörande maskinvara och programvara den faktiska mottagningen av de radiosignaler 5 som representerar polyfona ljudsignaler. Här utförs typiska funktionaliteter, såsom t.ex. felkorrigering. En avkodare 24 avkodar de mottagna radiosignalerna 5 och omvandlar det ljuddata som bärs därav till signaler för ett antal utgångskanaler 26. Utgångssignalerna kan tillhandahållas till t.ex. högtalare 29 för omedelbar presentation, eller kan lagras i någon sorts ljudsignalslagring 28.At the receiver side 20, an antenna 22 with associated hardware and software handles the actual reception of the radio signals 5 representing polyphonic audio signals. Here, typical functionalities are performed, such as e.g. error correction. A decoder 24 decodes the received radio signals 5 and converts the audio data carried therefrom into signals for a number of output channels 26. The output signals can be provided to e.g. speakers 29 for immediate presentation, or can be stored in some kind of audio signal storage 28.

Systemet l kan tillexempel vara ett telefonkonferenssystem, ett system för tillhandahållande av ljudservice eller andra ljudtillämpningar. I vissa system, såsom t.ex. telefonkonferenssystem måste kommunikationen vara av duplextyp, medan t.ex. distribution av musik från en servicetillhanda- hållare till en abonnent kan vara av en väsentligen enkelriktad typ.The system 1 may be, for example, a telephone conference system, a system for providing audio service or other audio applications. In some systems, such as e.g. telephone conference systems, the communication must be of the duplex type, while e.g. Distribution of music from a service provider to a subscriber can be of a substantially one-way type.

Signalernas överföring från sändaren 10 till mottagaren 20 kan också utföras med vilka andra medel som helst, t.ex. såväl olika sorters elektromagnetiska vågor, kablar eller fibrer som kombinationer därav.The transmission of the signals from the transmitter 10 to the receiver 20 can also be performed by any other means, e.g. both different types of electromagnetic waves, cables or fibers and combinations thereof.

Fig. 2a illustrerar en utföringsform av en kodare enligt den föreliggande uppfinningen. I denna utföringsform är den polyfona signalen en stercosignal som innefattar två kanaler a och b, mottagna vid ingångar 16A respektive l6B. Signalerna i kanal a och b tillhandahålls till en förbearbetningsenhet 32, där olika signalkonditionerande procedurer kan utföras. De (kanske modifierade) signalerna från förbearbetningsenhetens 32 utgång summeras i en additionsenhet 34. Denna additionsenhet 34 delar även summan med en faktor två. Signalen xmono som bildas på detta sätt är en huvudsignal för stereosignalen, eftersom den i grunden innefattar allt data från båda kanalerna. I denna utföringsform representerar alltså huvudsignalen en ren "mono"-signal. Huvudsignalen xmono tillhandahålls till 10 15 20 25 30 527 670 9 en huvudsignalskodarenhet 38, vilken kodar huvudsignalen enligt någon lämplig kodningsprincip. Sådana principer ñnns tillgängliga vid teknikens ståndpunkt och diskuteras alltså inte vidare här. Huvudsignalskodar- enheten 38 ger en utgångssignal pmom som utgörs av kodade parametrar som representerar en huvudsignal.Fig. 2a illustrates an embodiment of an encoder according to the present invention. In this embodiment, the polyphonic signal is a stereo signal comprising two channels a and b, received at inputs 16A and 16B, respectively. The signals in channels a and b are provided to a preprocessor 32, where various signal conditioning procedures can be performed. The (perhaps modified) signals from the output of the preprocessor 32 are summed in an addition unit 34. This addition unit 34 also divides the sum by a factor of two. The signal xmono formed in this way is a main signal for the stereo signal, since it basically includes all the data from both channels. Thus, in this embodiment, the main signal represents a pure "mono" signal. The main signal xmono is provided to a main signal encoder unit 38, which encodes the main signal according to any suitable coding principle. Such principles are available from the state of the art and are therefore not discussed further here. The main signal encoder unit 38 provides an output signal pmom which consists of coded parameters representing a main signal.

I en subtraktionsenhet 36 tillhandahålls en skillnad (dividerad med en faktor två) mellan kanalsignalerna som en sidosignal xslae. l denna utföringsform representerar sidosignalen skillnaden mellan de två kanalerna i stereosignalen. Sidosignalen xside tillhandahålls till en sidosignalskodarenhet 30. Föredragna utföringsformer av sidosignalskodarenheten 30 kommer att diskuteras vidare nedan. Enligt en sidosignalskodningsprocedur, vilken kommer att beskrivas mer i detalj nedan, överförs sidosignalen xside till kodningsparametrar pad, som representerar en sidosignal xside. I vissa utföringsformer äger denna kodning rum genom att utnyttja även information från huvudsignalen xmono. Pilen 42 indikerar ett sådant tillhandahållande, där den ursprungliga okodade huvudsignalen xmono utnyttjas. I ytterligare andra utföringsforrner kan den huvudsignals- information som används i sidosignalskodarenheten 30 härledas från de kodningsparametrar pmm, som representerar huvudsignalen, såsom indikeras av den streckade linjen 44.In a subtraction unit 36, a difference (divided by a factor of two) between the channel signals is provided as a side signal xslae. In this embodiment, the side signal represents the difference between the two channels in the stereo signal. The side signal xside is provided to a side signal encoder unit 30. Preferred embodiments of the side signal encoder unit 30 will be further discussed below. According to a side signal coding procedure, which will be described in more detail below, the side signal xside is transmitted to the coding parameters pad, which represents a side signal xside. In some embodiments, this encoding takes place by also utilizing information from the main signal xmono. Arrow 42 indicates such a provision, where the original uncoded main signal xmono is used. In still other embodiments, the main signal information used in the side signal encoder 30 may be derived from the coding parameters pmm representing the main signal, as indicated by the dashed line 44.

De kodningsparametrar pmono som representerar huvudsignalen xmono är en första utgångssígnal, och de kodningsparametrar pside som representerar sidosignalen xside är en andra utgångssignal. I ett typiskt fall multiplexeras dessa två utgångssignaler pmono, psme som tillsammans representerar hela stereoljudet till en överföringssignal 52 i en multiplexeringsenhet 40. I andra utföringsformer kan emellertid överföringen av de första och andra utgångssignalerna pmono, psme ske separat.The pmono coding parameters representing the main signal xmono are a first output signal, and the pside coding parameters representing the side signal xside are a second output signal. Typically, these two output signals are multiplexed pmono, psme which together represent the entire stereo sound of a transmission signal 52 in a multiplexing unit 40. In other embodiments, however, the transmission of the first and second output signals pmono, psme may take place separately.

I fig. 2b illustreras en utföringsform av en avkodare 24 enligt den föreliggande uppfinningen som ett blockschema. Den mottagna signalen 54 som innefattar kodningsparametrar som representerar huvud- och 10 15 20 25 30 527 670 10 sidosignalsinformationen tillhandahålls till en demultiplexeríngsenhet 56, vilken separerar en första respektive andra ingångssignal. Den första ingångssignalen som motsvarar kodningsparametrarna pmom för en huvudsignal tillhandahålls till en huvudsignalsavkodarenhet 64. På ett konventionellt sätt används de kodningsparametrar pmom, som representerar huvudsignalen för att bilda en avkodad huvudsignal x"m°n°, vilken är så lik huvudsignalen xmono (lig. 2a) i kodaren 14 (fig. 2a) som möjligt.I fi g. 2b, an embodiment of a decoder 24 according to the present invention is illustrated as a block diagram. The received signal 54 which includes coding parameters representing the main and side signal information is provided to a demultiplexing unit 56, which separates a first and a second input signal, respectively. The first input signal corresponding to the coding parameters pmom for a main signal is provided to a main signal decoder 64. In a conventional manner, the coding parameters pmom representing the main signal are used to form a decoded main signal x "m ° n °, which is so similar to the main signal xmon. 2a) in the encoder 14 (Fig. 2a) as possible.

På. liknande sätt tillhandahålls den andra ingångssignalen som motsvarar en sidosignal till en sidosignalsavkodarenhet 60. Här används de kodnings- parametrar pside som representerar sidosignalen för att återställa en avkodad sidosignal x"sme. I vissa utföringsformer utnyttjar avkodningsproceduren information om huvudsignalen x"m.,,m, såsom indikeras av pil 65.On. similarly, the second input signal corresponding to a side signal is provided to a side signal decoder 60. Here, the pside coding parameters representing the side signal are used to reset a decoded side signal x "sme. In some embodiments, the decoding procedure utilizes information about the main signal x" m. , as indicated by arrow 65.

De avkodade huvud- och sidosignalerna xfinonc, x"smc tillhandahålls till en additionsenhet 70, vilken tillhandahåller en utgångssignal som är en representation av den ursprungliga signalen för kanal a. På liknande sätt tillhandahåller en differens som tillhandahålls av en subtraktionsenhet 68 en utgångssignal som är en representation av den ursprungliga signalen för kanal b. Dessa kanalsígnaler kan efterbearbetas i en efterbearbetningsenhet 74 enligt signalbearbetningsprocedurer enligt teknikens ståndpunkt.The decoded main and side signals x fi nonc, x "smc are provided to an addition unit 70, which provides an output signal which is a representation of the original signal for channel a. Similarly, a difference provided by a subtraction unit 68 provides an output signal which is a representation of the original signal for channel b. These channel signals can be post-processed in a post-processing unit 74 according to prior art signal processing procedures.

Slutligen tillhandahålls kanalsignalerna a och b till avkodarens utgångar 26A och 26B.Finally, the channel signals a and b are provided to the outputs 26A and 26B of the decoder.

Såsom nämndes i sammanfattningen utförs kodning typiskt sett i en ram i taget. En ram innefattar ljudsarnpel inom en fördeñnierad tidsperiod. I den nedre delen av ñg. 3a illustreras en ram SF2 med en tidsvaraktighet L.As mentioned in the summary, coding is typically performed in one frame at a time. A frame includes sound snippets within a predetermined time period. In the lower part of ñg. 3a illustrates a frame SF2 with a time duration L.

Ljudsamplen inom den icke streckade delen ska kodas tillsammans. De föregående samplen och de efterföljande samplen kodas i andra ramar.The audio samples within the non-dashed part must be coded together. The previous samples and the subsequent samples are encoded in other frames.

Uppdelningen av samplen i ramar kommer i alla fall att införa några diskontinuiteter vid ramgränserna. Förändrade ljud kommer att ge förändrade kodningsparametrar, vilka i princip ändras vid varje ramgräns.The division of the samples into frames will in any case introduce some discontinuities at the frame boundaries. Changed sounds will result in changed coding parameters, which in principle change at each frame limit.

Detta kommer att ge upphov till perceptionsfel. Ett sätt att kompensera 10 15 20 25 30 527 670 ll något för detta är att basera kodningen, inte endast på de sampel som ska kodas, utan också på sampel i ramens absoluta omgivning, såsom indikeras av de streckade delarna. På ett sådant sätt kommer det att bli en mjukare övergång mellan de olika ramarna. Som ett alternativ, eller komplement, kan ibland interpoleringstekniker också utnyttjas för att minska perceptions- artefakter som orsakas av ramgränser. Alla sådana procedurer fordrar emellertid stora tillkommande beräkningsresurser, och för vissa specifika kodningstekniker kan det också vara svårt att tillhandahålla med vilka resurser som helst.This will give rise to perceptual errors. One way to compensate for this is to base the coding, not only on the samples to be coded, but also on samples in the absolute environment of the frame, as indicated by the dashed portions. In such a way, there will be a smoother transition between the different frames. As an alternative, or complement, interpolation techniques can sometimes also be used to reduce perception artifacts caused by frame boundaries. However, all such procedures require large additional computational resources, and for some specific coding techniques, it may also be difficult to provide with any resources.

Ur denna synvinkel är det fördelaktigt att utnyttja så långa ramar som möjligt, eftersom antalet ramgränser kommer att vara litet. Även kodningseffektiviteten blir typiskt sett hög och den nödvändiga överföringsbithastigheten kommer typiskt sett att minimeras. Emellertid ger långa ramar problem med för-eko-artefakter och spökliknande ljud.From this point of view, it is advantageous to use as long frames as possible, as the number of frame limits will be small. The coding efficiency will also typically be high and the necessary transmission bit rate will typically be minimized. However, long frames cause problems with pre-eco-artifacts and ghost-like sounds.

Genom att istället utnyttja korta ramar, såsom SFl eller till och med SFO, vilka har varaktigheterna L/2 respektive L/ 4, inser fackmannen att kodníngseffektiviteten kan minska, överföringsbíthastigheten kan behöva vara högre och problemen med rarngränsartefakter kommer att öka. Kortare ramar lider emellertid mindre av t.ex. andra perceptionsartefakter, såsom spökliknande ljud och för-ekande. För att kunna minimera kodningsfelet så mycket som möjligt bör man använda en så kort ramlängd som möjligt.By using short frames instead, such as SF1 or even SFO, which have the durations L / 2 and L / 4, respectively, those skilled in the art will recognize that the coding efficiency may decrease, the transmission bit rate may need to be higher and the problems with boundary artifacts will increase. However, shorter frames suffer less from e.g. other perceptual artifacts, such as ghostly sounds and echoes. In order to minimize the coding error as much as possible, you should use as short a frame length as possible.

Enligt den föreliggande uppfinningen kommer ljudperceptionen att förbättras genom att använda en ramlängd för kodning av sidosignalen som är beroende på det aktuella signalinnehållet. Eftersom olika ramlängders påverkan på ljudperceptionen kommer att skilja sig beroende på naturen av det ljud som ska kodas, kan en förbättring erhållas genom att låta själva signalens natur påverka den ramlängd som används. Huvudsignalen kodning är inte den föreliggande uppñnningens objekt och beskrivs därför inte i detalj. Emellertid kan eller kan inte de ramlängder som används för huvudsignalen vara lika med de ramlängder som används för sidosignalen. 10 15 20 25 30 527 670 12 På grund av små tidsvariationer, kan det t.ex. i vissa fall vara fördelaktigt att koda sidosignalen med användning av relativt långa ramar. Detta kan vara fallet med inspelningar med ett stort mått av diffust ljudfält såsom konsertinspelningar. I andra fall, såsom samtal med stereotal, kan korta ramar vara att föredra. Avgörandet vilken ramlängd som är att föredra kan göras på två grundläggande sätt.According to the present invention, the sound perception will be improved by using a frame length for encoding the side signal which is dependent on the actual signal content. Since the influence of different frame lengths on the sound perception will differ depending on the nature of the sound to be coded, an improvement can be obtained by allowing the nature of the signal itself to affect the frame length used. The main signal coding is not the object of the present invention and is therefore not described in detail. However, the frame lengths used for the main signal may or may not be equal to the frame lengths used for the side signal. 10 15 20 25 30 527 670 12 Due to small time variations, it can e.g. in some cases it may be advantageous to encode the side signal using relatively long frames. This may be the case with recordings with a large amount of diffused sound field such as concert recordings. In other cases, such as stereo calls, short frames may be preferable. Deciding which frame length is preferable can be done in two basic ways.

En utföringsform av en sidosignalskodarenhet 30 enligt den föreliggande uppfinningen illustreras i fig. 3b, i vilken ett beslut i sluten krets utnyttjas.An embodiment of a side signal encoder unit 30 according to the present invention is illustrated in Figs. 3b, in which a decision in a closed circuit is used.

En grundläggande kodningsram av längd L används här. Ett antal kodningsscheman 81, kännetecknade av en separat uppsättning 80 av delramar 90, skapas. Varje uppsättning 80 av delramar 90 innefattar en eller flera delramar 90 av lika eller olika längder. Den totala längden av uppsättningen 80 av delramar 90 är emellertid alltid lika med den grundläggande kodningsramlängden L. Med hänvisning till fig. 3b kännetecknas det översta kodningsschemat av en uppsättning av delramar som innefattar endast en delram med längd L. Nästa uppsättning av delramar innefattar två ramar av längd L/ 2. Den tredje uppsättningen innefattar två ramar med längd L/ 4, åtföljda av en L/ 2-ram.A basic coding frame of length L is used here. A number of coding schemes 81, characterized by a separate set 80 of subframes 90, are created. Each set 80 of subframes 90 includes one or more subframes 90 of equal or different lengths. However, the total length of the set 80 of subframes 90 is always equal to the basic coding frame length L. Referring to fi g. 3b, the top coding scheme is characterized by a set of subframes comprising only one subframe of length L. The next set of subframes comprises two frames of length L / 2. The third set comprises two frames of length L / 4, accompanied by an L / 2 -frame.

Signalen Xside som tillhandahölls till sidosignalskodarenheten 30 kodas av alla kodningsscheman 81. I det översta kodningsschemat kodas hela den grundläggande kodningsramen i ett stycke. I de andra kodningsschemana kodas emellertid signalen xsmc i varje delram separat från varandra.The Xside signal provided to the side signal encoder 30 is encoded by all encoding schemes 81. In the top encoding scheme, the entire basic encoding frame is encoded in one piece. However, in the other coding schemes, the signal xsmc in each subframe is coded separately from each other.

Resultatet från varje kodningsschema tillhandahålls till en väljare 85. Ett organ 83 för naturtrogenhetsmätning bestämmer ett naturtrogenhetsmått för var och en av de kodade signalerna. Naturtrogenhetsmåttet är ett objektivt kvalitetsvärde, företrädesvis ett signal-till-brus-mått eller ett viktat signal-till-brus-förhållande. De naturtrogenhetsmått som är förknippade med varje kodningsschema jämförs och resultatet styr ett omkopplingsorgan 87 för att välja ut de kodningsparametrar som representerar sidosignalen 10 15 20 25 30 527 670 13 från det kodníngsschema som ger det bästa naturtrogenhetsmättet som utgängssignalen pad, från sidosignalskodarenheten 30.The result of each coding scheme is provided to a selector 85. A natural fidelity measurement means 83 determines a natural fidelity measure for each of the coded signals. The natural fidelity measure is an objective quality value, preferably a signal-to-noise measure or a weighted signal-to-noise ratio. The natural fidelity measures associated with each coding scheme are compared and the result controls a switching means 87 for selecting the coding parameters representing the side signal 10 from the coding scheme giving the best natural fidelity measure as the output signal pad, from the side signal encoder 30.

Företrädesvis testas alla möjliga kombinationer av ramlängder och den uppsättning av delramar som ger den bästa objektiva kvaliteten, t.ex. signal- till-brus-förhållande väljs.Preferably, all possible combinations of frame lengths and the set of subframes that provide the best objective quality are tested, e.g. signal-to-noise ratio is selected.

I den föreliggande utföringsformen väljs längderna för de delramar som används enligt: l. där 1,, är delramarnas längder, I, är kodningsramens längd och n är ett heltal. I den föreliggande utföringsforrnen väljs n mellan O och 3. Vilka ramlängder som helst kan emellertid vara möjliga att använda, så länge som uppsättningens totala längd hålls konstant.In the present embodiment, the lengths of the subframes used are selected according to: 1. where 1, are the lengths of the subframes, I, is the length of the coding frame and n is an integer. In the present embodiment, n is chosen between 0 and 3. However, any frame lengths may be possible to use, as long as the total length of the set is kept constant.

I fig. 3c illustreras en annan utföringsform av en sidosignalskodarenhet 30 enligt den föreliggande uppfinningen. Här är ramlängdsbeslutet ett beslut i öppen krets, baserat på signalens statistik. Med andra ord, sidosignalens spektrala kännetecken kommer att användas som en grund för att besluta vilket kodníngsschema som ska användas. Såsom tidigare är olika kodningsscheman kännetecknade av olika uppsättningar av delramar tillgängliga. I denna utföringsform är emellertid väljaren 85 placerad före den faktiska kodningen. lngängssidosignalen xsme kommer in i väljaren 85 och en signalanalyseringsenhet 84. Resultatet av analysen blir insignalen till en omkopplare 86, i vilken endast ett av kodningsschemana 81 utnyttjas.I fi g. 3c illustrates another embodiment of a side signal encoder unit 30 according to the present invention. Here, the frame length decision is an open circuit decision, based on the signal statistics. In other words, the spectral characteristics of the side signal will be used as a basis for deciding which coding scheme to use. As before, different coding schemes characterized by different sets of subframes are available. In this embodiment, however, the selector 85 is located before the actual coding. The input side signal xsme enters the selector 85 and a signal analysis unit 84. The result of the analysis is the input signal to a switch 86, in which only one of the coding schemes 81 is used.

Utsignalen från det kodningsschemat kommer också att bli utgångssignalen pad, från sidosignalskodarenheten 30.The output signal from that encoding scheme will also be the output signal pad, from the side signal encoder unit 30.

Fördelen med ett beslut i öppen krets är att endast en faktisk kodning behöver genomföras. Nackdelen är emellertid att analysen av signalkännetecknen kan 10 15 20 25 30 527 670 14 vara verkligen mycket komplicerad och det kan vara svårt att förutse möjliga beteenden på förhand för att kunna ge ett lärnpligt val i omkopplaren 86. En stor mängd statistisk analys av ljud måste utföras och inbegripas i signalanalysenheten 84. Vilken liten ändring som helst i kodningsschemana kan vända upp och ned på det statistiska beteendet.The advantage of a decision in an open circuit is that only an actual coding needs to be performed. The disadvantage, however, is that the analysis of the signal characteristics can be really very complicated and it can be difficult to predict possible behaviors in advance in order to be able to make a learning choice in the switch 86. A large amount of statistical analysis of sound must performed and included in the signal analysis unit 84. Any small change in the coding schemes can turn the statistical behavior upside down.

Genom att använda val i sluten krets (fig. 3b) kan kodningsscheman bytas ut utan att göra några ändringar i resten av enheten. Å andra sidan, om många kodningsscheman måste undersökas kommer beräkningsfordringarna att vara höga.By using closed circuit selection (Fig. 3b), coding schemes can be replaced without making any changes to the rest of the unit. On the other hand, if many coding schemes have to be examined, the computational requirements will be high.

Fördelen med en sådan variabel rarnlängdskodning för sidosignalen är att man kan välja mellan å ena sidan en fin tidsupplösning och grov frekvensupplösning och å andra sidan en grov tidsupplösning och fin frekvensupplösning. De ovanstående utföringsforrnerna kommer att bevara stereobilden på bästa möjliga sätt.The advantage of such a variable frame length coding for the side signal is that one can choose between on the one hand a fine time resolution and coarse frequency resolution and on the other hand a coarse time resolution and fine frequency resolution. The above embodiments will preserve the stereo image in the best possible way.

Det finns även vissa fordringar på de faktiska kodningarna som utnyttjas i de olika kodningsschemana. I synnerhet när valet i sluten krets används måste beräkningsresurserna för att utföra ett antal av mer eller mindre samtidiga kodningar vara stora. Ju mer komplicerad kodningsprocessen är, ju mer beräkningskraít behövs. Vidare är en låg bithastighet vid överföring att föredra.There are also some requirements for the actual codings used in the various coding schemes. Particularly when the closed circuit selection is used, the computational resources to perform a number of more or less simultaneous encodings must be large. The more complicated the coding process, the more computational credit is needed. Furthermore, a low bit rate during transmission is preferred.

Förfarandet som presenterades i US 5,434,948 använder en filtrerad version av monosignalen (huvudsignalen) för att efterlikna sido- eller differenssignalen. Filterparametrarna optimeras och tillåts variera i tiden.The method presented in US 5,434,948 uses a filtered version of the mono signal (the main signal) to mimic the side or difference signal. The filter parameters are optimized and allowed to vary over time.

Filterparametrarna överförs sedan, vilka representerar en kodning av sidosignalen. I en utföringsforrn överförs även en restsidosignal. I många fall skulle ett sådant angreppssätt vara möjligt att använda som ett sidosignalskodningsförfarande inom den föreliggande uppfinningens omfattning. Detta angreppssätt har emellertid vissa nackdelar. Kvantiseringen av filterkoefñcienterna och eventuell restsidosignal fordrar ofta relativt höga 10 15 20 25 30 527 670 15 bithastigheter för överföring, eftersom filterordningen måste vara hög för att tillhandahålla en noggrann sidosignalsskattning. Filterskattningen själv kan vara problematisk, i synnerhet i fall med transientrik musik. Skattningsfel kommer att ge en modifierad sidosignal som ibland är större i magnitud än den omodiñerade signalen. Detta kommer att leda till högre bithastighetskrav.The filter parameters are then transmitted, which represent an encoding of the side signal. In one embodiment, a residual side signal is also transmitted. In many cases, such an approach would be possible to use as a side signal coding method within the scope of the present invention. However, this approach has some disadvantages. The quantization of the filter coefficients and any residual side signal often requires relatively high bit rates for transmission, since the filter order must be high to provide an accurate side signal estimate. The filter estimation itself can be problematic, especially in the case of transient-rich music. Estimation errors will give a modified side signal which is sometimes larger in magnitude than the unmodified signal. This will lead to higher bit rate requirements.

Vidare, om en ny uppsättning av ñlterkoefñcienter beräknas varje N:te sampel, behöver filterkoefficienterna interpoleras för att uppnå en mjuk övergång från en uppsättning av filterkoefficienter till en annan, såsom diskuterats ovan.Furthermore, if a new set of koltercoefficients is calculated every N sample, the koltercoefficients need to be interpolated to achieve a smooth transition from one set of koltercoefficients to another, as discussed above.

Interpolering av filterkoefñcienter är en komplicerad uppgift och fel i interpoleringen kommer uppenbara sig i större sidofelssignaler, vilka leder till att högre bithastigheter behövs för differensfelssignalkodaren.Interpolation of ko ltercoefficients is a complicated task and errors in the interpolation will manifest themselves in larger side error signals, which leads to higher bit rates being needed for the difference error signal encoder.

Ett medel för att undvika behovet av interpolering är att uppdatera filterkoefficienterna på en sampel-för-sampel-bas och att lita på baklänges adaptiv analys. För att detta ska fungera bra fordras att bithastigheten för restkodaren är ganska hög. Detta är därför inget bra alternativ för stereokodning med låg bithastighet.One means of avoiding the need for interpolation is to update the ko lter coefficients on a sample-by-sample basis and to rely on backward adaptive analysis. For this to work well, it is required that the bit rate of the residual encoder is quite high. This is therefore not a good option for low bit rate stereo coding.

Det förekommer fall, t.ex. ganska vanligt med musik, där mono- och differenssignalerna är nästan okorrelerade. Filterskattningen blir då mycket bekymmersam med den tillkommande risken att helt enkelt göra saker värre för differensfelssignalkodaren.There are cases, e.g. quite common with music, where the mono and difference signals are almost uncorrelated. The filter estimation then becomes very worrying with the added risk of simply making things worse for the difference error signal encoder.

Lösningen enligt US 5,434,948 kan fungera ganska bra i fall där filterkoefficienterna varierar mycket långsamt i tiden, t.ex. konferens- telefonisystem. I fallet med musiksignaler fungerar inte detta angreppssätt så bra eftersom filtren behöver ändras mycket snabbt för att följa stereobilden.The solution according to US 5,434,948 can work quite well in cases where the filter coefficients vary very slowly over time, e.g. conference telephony system. In the case of music signals, this approach does not work so well because the filters need to be changed very quickly to follow the stereo image.

Detta betyder att delramslängder av mycket skilda storlekar måste utnyttjas, _ vilket betyder att antalet kombinationer att testa snabbt ökar. Detta betyder i sin tur att fordringarna för att beräkna alla möjliga kodningsschernan blir opraktiskt höga. 10 15 20 25 30 527 670 16 I en föredragen utföringsform grundar sig därför kodníngen av sidosignalen på idén att reducera redundansen mellan mono- och sidosignalen genom att balansfaktor istället för ett bithastighetsförbrukande prediktorfilter. Resten från denna operation kodas använda en enkel komplext sedan. Storleken av en sådan rest är relativt liten och föranleder inte mycket höga bithastighetsbehov för överföring. Denna idé är verkligen mycket lämplig att kombinera med angreppssättet med variabel ramuppsättning som beskrivits tidigare, eftersom beräkningskomplexiteten är låg.This means that subframe lengths of very different sizes must be used, which means that the number of combinations to test is rapidly increasing. This in turn means that the requirements for calculating all possible coding chips become impractically high. Therefore, in a preferred embodiment, the coding of the side signal is based on the idea of reducing the redundancy between the mono and side signals by balancing factor instead of a bit rate consuming predictor filter. The rest of this operation is coded using a simple complex sedan. The size of such a residue is relatively small and does not give rise to very high bit rate requirements for transmission. This idea is really very suitable to combine with the variable frame set approach described earlier, as the computational complexity is low.

Användningen av en balansfaktor kombinerad med angreppssättet med variabel ramlängd avlägsnar behovet av komplex interpolering och de förknippade problem som interpolering kan orsaka. Vidare ger användningen av en enkel balansfaktor istället för ett komplext filter färre problem med skattningar eftersom möjliga skattningsfel för balansfaktorn har mindre inverkan. Den föredragna lösningen kommer att kunna återskapa både panorerande signaler och diffusa ljudfält med god kvalitet och med begränsade bithastighetsfordringar och beräkningsresurser.The use of a balance factor combined with the variable frame length approach removes the need for complex interpolation and the associated problems that interpolation can cause. Furthermore, the use of a simple balance factor instead of a complex filter gives fewer problems with estimates because possible estimation errors for the balance factor have less impact. The preferred solution will be able to recreate both panning signals and diffused sound fields with good quality and with limited bit rate requirements and computational resources.

Fig. 4 illustrerar en föredragen utföringsform för en stereokodare enligt den föreliggande uppfinningen. Denna utföringsform är mycket lik den som visas i fig. 2a, emellertid med sídosignalskodarenhetens 30 detaljer avslöjade.Fig. 4 illustrates a preferred embodiment of a stereo encoder according to the present invention. This embodiment is very similar to that shown in Fig. 2a, however with the details of the side signal encoder 30 revealed.

Kodaren 14 i denna utföringsform har inte någon förbearbetningsenhet och ingångssignalema tillhandahålls direkt till additions- och subtraktion- senheterna 34, 36. Monosignalen xmono multipliceras med en viss balansfaktor gm i en multiplikator 33. I en subtraktionsenhet 35 subtraheras den multiplicerade monosignalen från sidosignalen xside, dvs. väsentligen skillnaden mellan de två kanalerna, för att ge en sidorestsignal. Balansfaktorn gsm bestäms baserat på mono- och sidosignalernas innehåll av optimeraren 37 för att minimera sidorestsignalen enligt ett kvalitetskriterium. Kvalitets- kriteriet är företrädesvis ett minsta-kvadratkriterium. Sidorestsignalen kodas i en sidorestkodare 39 enligt vilka kodningsprocedurer som helst. Företrädesvis är sidorestkodaren 39 en transformkodare för låg bithastighet eller en CELP- kodare (kodboksexciterad linjär prediktion, eng. "Codebook Excited Linear 10 15 20 25 30 527 670 17 Prediction"). De kodningsparametrar psmc som representerar sidosignalen innefattar då de kodningsparametrar psid., fesidum som representerar sidorest- signalen och den optimerade balansfaktorn 49.The encoder 14 in this embodiment has no preprocessor and the input signals are provided directly to the addition and subtraction units 34, 36. The mono signal xmono is multiplied by a certain balance factor gm in a multiplier 33. In a subtraction unit 35 the multiplied mono signal is subtracted from the side signal x. . essentially the difference between the two channels, to give a residual signal. The balance factor gsm is determined based on the content of the mono and side signals by the optimizer 37 to minimize the side residual signal according to a quality criterion. The quality criterion is preferably a least squares criterion. The residual signal is encoded in a residual encoder 39 according to any coding procedures. Preferably, the page residual encoder 39 is a low bit rate transform encoder or a CELP (Codebook Excited Linear Prediction). The coding parameters psmc representing the side signal then include the coding parameters psid., Fesidum representing the side residual signal and the optimized balance factor 49.

I utfóringsforrnen i fig. 4 är den monosignal 42 som används för syntetisering av sidosignalema monokodarens 38 målsignal xmom. Såsom nämnts ovan (i samband med fig. 2a), kan monokodarens 38 lokala syntetiseringssignal också utnyttjas. I det senare fallet kan den totala kodarfördröjningen öka och sidosignalens beräkningskomplexitet kan öka. Å andra sidan kan kvaliteten bli bättre eftersom det då är möjligt att reparera kodningsfel orda i monokodaren.In the execution form in fi g. 4, the mono signal 42 used to synthesize the side signals is the target signal xmom of the monocoder 38. As mentioned above (in connection with fi g. 2a), the local synthesizing signal of the monocoder 38 can also be used. In the latter case, the total encoder delay may increase and the computational complexity of the side signal may increase. On the other hand, the quality can be better because then it is possible to repair coding errors in the monocoder.

På. ett mer matematiskt sätt kan det grundläggande kodningsschemat beskrivas såsom följer. Beteckna de tvä kanalsignalema såsom a och b, vilka kan vara den vänstra och högra kanalen i ett stereopar. Kanalsignalerna kombineras till en monosignal genom addition och till en sidosignalgenom en subtraktion. I ekvationsform beskrivs operationerna som: xmán) = 0-5(a(f=)+ 1201)) x,.»l.,(fl)= 0-5(<1(n)-b(fl)) - Det är fördelaktigt att skala ner xmono- och xside-signalerna med en faktor två.On. in a more mathematical way, the basic coding scheme can be described as follows. Denote the two channel signals such as a and b, which may be the left and right channels in a stereo pair. The channel signals are combined into a mono signal by addition and into a side signal through a subtraction. In equation form, the operations are described as: xmán) = 0-5 (a (f =) + 1201)) x,. »L., (Fl) = 0-5 (<1 (n) -b (fl)) - It is advantageous to scale down the xmono and xside signals by a factor of two.

Det antyds här att andra sätt att skapa xmøno och Xside finns. Man kan till exempel använda: XMÅH) = w(n)+ (1 - r)b(~) nu. (n) = w(n)- (1 - r)b(n) O S 7 S 1.0 .It is suggested here that there are other ways to create xmøno and Xside. For example, you can use: XMÅH) = w (n) + (1 - r) b (~) nu. (n) = w (n) - (1 - r) b (n) O S 7 S 1.0.

En modifierad eller restsidosignal beräknas pä block av insignalerna enligt: xsideruiduul (n) = xxide (n) _ f(xmono.xxide )xmmm (n) Y 10 15 20 25 527 670 18 där flxmuno, Xsme) är en balansfaktorfunktion som baserad på blocket av N sampel, dvs. en delram, från sido- och monosignalerna strävar efter att avlägsna så. mycket som möjligt från sidosignalen. Med andra ord, balansfaktorn används för att minimera restsidosignalen. I specialfallet där den minimeras i en minstakvadratbemärkelse, är detta ekvivalent med att minimera restsídosignalens xsme fesidum energi.A modified or residual side signal is calculated on blocks of the input signals according to: xsideruiduul (n) = xxide (n) _ f (xmono.xxide) xmmm (n) Y 10 15 20 25 527 670 18 where fl xmuno, Xsme) is a balance factor function based on the block of N samples, i.e. a subframe, from the side and mono signals strives to remove so. as much as possible from the side signal. In other words, the balance factor is used to minimize the residual side signal. In the special case where it is minimized in a least squares sense, this is equivalent to minimizing the xsme fesidum energy of the residual side signal.

I det ovan nämnda specialfallet beskrivs f (xmmpxflde) som: R f(xmono 9 xsídu) = RM MM frameend RM", 1 í z xfilflllß (n)xm07|0 rwframesrarr frame/nd Rsm = [ E xxide (ràxmono (n 2 n=finmesinrt där xsidc är sidosignalen och Xmono är monosignalen. Notera att funktionen grundar sig på ett block som börjar vid "frame start" och slutar vid "frame end".In the above-mentioned special case, f (xmmpx fl de) is described as: R f (xmono 9 xsídu) = RM MM frameend RM ", 1 í z x fi l fl llß (n) xm07 | 0 rwframesrarr frame / nd Rsm = [E xxide (ràxmono (n 2 n = fi nmesinrt where xsidc is the side signal and Xmono is the mono signal, note that the function is based on a block that starts at "frame start" and ends at "frame end".

Det är möjligt att lägga till viktning i frekvensdomänen till beräkningen av balansfaktorn. Detta görs genom att falta xside- och xmono-signalerna med ett viktningsfilters impulssvar. Det är sedan möjligt att flytta skattningsfelet till ett frekvensområde där de är mindre lätta att höra. Detta kallas perceptionsviktning.It is possible to add weighting in the frequency domain to the calculation of the balance factor. This is done by folding the xside and xmono signals with the impulse response of a weighting filter. It is then possible to extend the estimation error to a frequency range where they are less easy to hear. This is called perception weighting.

En kvantiserad version av det balansfaktorvärde som ges av funktionen f (xmo,,,,x,,.d,) överförs till avkodaren. Det är att föredra att ta hänsyn till kvantiseringen redan när den modifierade sidosignalen skapas. Uttrycket nedan erhålls då: 10 15 20 25 527 670 19 xside rexidual (n) = xxide 01)- g Q x mono (n) _ R ,,, gg = Q-'lßßírll ~ Qg(..) är en kvantiseringsfunktion som appliceras på den balansfaktor som ges av funktionen f (xmww,x_,,de). Balansfaktorn överförs på överförings- kanalen. I normala vänster-höger-panorerande signaler begränsas balans- faktorn till intervallet [-l.O 1.01. Om å andra sidan kanalerna är ur fas i förhållande till varandra kan balansfaktorn sträcka sig bortom dessa gränser.A quantized version of the balance factor value given by the function f (xmo ,,,, x ,,. D,) is transmitted to the decoder. It is preferable to take quantization into account already when the modified side signal is created. The expression below is then obtained: 10 15 20 25 527 670 19 xside rexidual (n) = xxide 01) - g Q x mono (n) _ R ,,, gg = Q-'lßßírll ~ Qg (..) is a quantization function which applied to the balance factor given by the function f (xmww, x _ ,, de). The balance factor is transmitted on the transmission channel. In normal left-right panning signals, the balance factor is limited to the interval [-l.O 1.01. On the other hand, if the channels are out of phase with each other, the balance factor can extend beyond these limits.

Som ett extra medel för att stabilisera stereobilden kan man begränsa balansfaktorn om den normaliserade korskorrelationen mellan mono- och sidosignalen är liten såsom den ges av ekvationen nedan: gg =Q§'lQ-ll§llš;:ll* där R _ .VTI .gsm V Rs: Rmm fi-ameend Run = [ E xside (ràxmrmo (n ' n-fmme :um Dessa situationer uppträder ganska ofta med t.ex. klassisk musik eller studiomusik med en stor andel diffust ljud, där i vissa fall a- och b-kanalerna i stort sett skulle kunna släcka ut varandra vid vissa tillfällen när en monosignal skapas. Effekten på balansfaktorn är att den kan hoppa snabbt, vilket orsakar en förvirrad stereobild. Fixeringen ovan mildrar detta problem. 10 15 20 25 30 527 670 20 Det filterbaserade angreppssättet i US 5,434,948 har liknande problem, men i det fallet är inte lösningen så enkel.As an additional means of stabilizing the stereo image, one can limit the balance factor if the normalized cross-correlation between the mono and side signal is small as given by the equation below: gg = Q§'lQ-ll§llš;: ll * where R _ .VTI. gsm V Rs: Rmm fi- ameend Run = [E xside (ràxmrmo (n 'n-fmme: um These situations occur quite often with eg classical music or studio music with a large proportion of diffused sound, where in some cases a- and the b-channels could largely extinguish each other at certain times when a mono signal is created.The effect on the balance factor is that it can jump fast, causing a confused stereo image.The fixation above alleviates this problem.10 15 20 25 30 527 670 20 The alter-based approach in US 5,434,948 has similar problems, but in that case the solution is not so simple.

Om E: är kodningsfunktionen (t.ex. en transformkodare] för restsidosignalen och En, är monosignalens kodningsfunktion, då kan de avkodade a"- och b"- signalerna i avkodaränden beskrivas som (det antas här att 7 = 0.5 ): a'(n) = + gQ )x;nno (n) + xzide (n) bin) = (1 - g., )»;.,.. (~>- (n) xçíde = Ex. 1 (xxide rexidual xfïiflïlfl = (XUNOPIO En viktig fördel med att beräkna balansfaktorn för varje ram är att man undviker användningen av interpolering. Istället, såsom beskrevs ovan, utförs normalt rambearbetningen med överlappande ramar.If E: is the coding function (eg a transform encoder] for the residual side signal and En, is the coding function of the mono signal, then the decoded a "and b" signals at the decoder end can be described as (it is assumed here that 7 = 0.5): a ' (n) = + gQ) x; nno (n) + xzide (n) bin) = (1 - g.,) »;., .. (~> - (n) xçíde = Ex. 1 (xxide rexidual xfïi fl ïlfl = (XUNOPIO An important advantage of calculating the balance factor for each frame is that the use of interpolation is avoided. Instead, as described above, the frame machining is normally performed with overlapping frames.

Den kodningsprincip som använder balansfaktorer verkar särskilt bra i fall av musiksignaler, där snabba ändringar typiskt sett behövs för att följa stereobilden.The coding principle that uses balance factors works particularly well in the case of music signals, where rapid changes are typically needed to follow the stereo image.

På senare tid har multikanalskodning blivit populärt. Ett exempel är 5.1-kanal omgivningsljud (eng. 5.lchannel surround sound) i DVD-filmer. Kanalerna arrangeras där som: front vänster, front mitten, front höger, bakre vänster, bakre höger och Subwoofer. I fig. 5 visas en utföringsform av en kodare som kodar de tre frontkanalerna i ett sådant arrangemang under användning av interkanalredundanser enligt den föreliggande uppfinningen.Recently, multi-channel coding has become popular. An example is 5.1 channel surround sound in DVD movies. The channels are arranged there as: front left, front center, front right, rear left, rear right and subwoofer. Fig. 5 shows an embodiment of an encoder which encodes the three front channels in such an arrangement using interchannel redundancies according to the present invention.

Tre kanalsignaler L, C, R tillhandahålls på tre ingångar 16A-C, och monosignalen xmom skapas genom en summa av alla tre signaler. En mittensignalkodarenhet 130 är tillagd, vilken tar emot mittensignalen xcentfe.Three channel signals L, C, R are provided at three inputs 16A-C, and the mono signal xmom is created by a sum of all three signals. A center signal encoder unit 130 is added, which receives the center signal xcentfe.

Monosignalen 42 är i denna utföringsform den kodade och avkodade monosignalen x"m°n°, och multipliceras med en viss balansfaktor gQ i en lO 15 20 25 30 527 670 21 multiplikator 133. I en subtraktionsenhet 135 subtraheras den multiplicerade monosignalen från mittensígnalen Xcenue för att ge en mittenrestsignal. Balansfaktorn gQ bestäms grundat på mono- och mitten- signalernas innehåll av en optimerare 137 för att minimera mittenrest- signalen enligt kvalitetskriteriet. Mittenrestsignalen kodas i en mittenrest- kodare 139 enligt någon kodarprocedur. Företrädesvis är mittenrestkodaren 139 en transformkodare för låg bithastighet eller en CELP-kodare. De kodningsparametrar pwme som representerar mittensígnalen innefattar dä kodningsparametrarna pcenue fesiauai som representerar mittenrestsignalen samt den optimerade balansfaktorn 149. Míttenrestsignalen och den skalade monosignalen adderas i en additionsenhet 235, vilken skapar en modifierad mittensignal 142 som är kompenserad för kodningsfel.The mono signal 42 in this embodiment is the coded and decoded mono signal x "m ° n °, and multiplied by a certain balance factor gQ in a multiplier 133. In a subtraction unit 135, the multiplied mono signal is subtracted from the center signal Xcenue for The balance factor gQ is determined based on the content of the mono and center signals by an optimizer 137 to minimize the center residual signal according to the quality criterion The center residual signal is encoded in a center residual encoder 139 according to some encoder procedure. The encoding parameters pwme representing the center signal then include the encoding parameters pcenue fesiauai representing the center residual signal and the optimized balance factor 149. The center residual signal and the scaled mono signal are added in a component of the addition signal el.

Sidosignalen xside, dvs. skillnaden mellan de vänstra L och högra R kanalerna tillhandahålls till sidosignalskodarenheten 30 som i tidigare utföringsformer. Här beror emellertid optimeraren 37 på den modifierade mittensignal 142 som tillhandahålls av mittensignalskodarenheten 130.The side signal xside, i.e. the difference between the left L and right R channels is provided to the side signal encoder unit 30 as in previous embodiments. Here, however, the optimizer 37 depends on the modified center signal 142 provided by the center signal encoder unit 130.

Sidorestsignalen kommer därför att skapas som en optimal linjärkombination av monosignalen 42, den modifierade mittensígnalen 142 och sidosignalen i subtraktionsenheten 35.The side residual signal will therefore be created as an optimal linear combination of the mono signal 42, the modified center signal 142 and the side signal in the subtraction unit 35.

Konceptet med variabel ramlängd som beskrevs ovan kan tillämpas på någon av sido- och mittensignalerna, eller på båda.The variable frame length concept described above can be applied to either of the side and center signals, or to both.

Fig. 6 illustrerar en avkodarenhet som är lämplig för att ta emot kodade ljudsignaler från kodarenheten i fig. 5. Den mottagna signalen 54 delas in i kodningsparametrar pmom som representerar huvudsignalen, kodnings- parametrar Damm.- som representerar míttensignalen och kodningsparametrar pad, som representerar sidosignalen. I avkodaren 64 används de kodningsparametrar pmm, som representerar huvudsignalen för att skapa en huvudsignal x"m0n0. I avkodaren 160 används de kodningsparametrar pmm som representerar mittensígnalen för att skapa en mittensignal :Ckenzl-e, baserad på huvudsignalen xflnono. l avkodaren 60 avkodas de kodnings- 10 15 20 25 527 670 22 parametrar pside som representerar sidosignalen, vilket skapar en sidosignal xäde, baserat på huvudsignal xfinono och mittensignal xkentfe.Fig. 6 illustrates a decoder unit suitable for receiving coded audio signals from the encoder unit in fi g. 5. The received signal 54 is divided into coding parameters pmom representing the main signal, coding parameters Damm.- representing the center signal and coding parameters pad representing the side signal. The decoder 64 uses the coding parameters pmm, which represent the main signal, to create a main signal x "m0n0. coding parameters pside representing the side signal, which creates a side signal xäde, based on main signal x fi nono and center signal xkentfe.

Proceduren kan uttryckas matematiskt såsom följer: Ingångssignalerna Xiefi, Xfight och xwm kombineras till en monokanal enligt: xmonn (n) = æçlq/l (n) + ßxrighl (n) + xx centre (n ) ' a , ,ß och g är i den återstående sektionen satta till 1,0 för enkelhets skull, men de kan sättas till godtyckliga värden. a -, ß- and x-värdena kan antingen vara konstanta eller bero på signalinnehållen för att betona en eller två kanaler för att erhålla en optimal kvalitet.The procedure can be expressed mathematically as follows: The input signals Xiefi, X fi ght and xwm are combined into a mono channel according to: xmonn (n) = æçlq / l (n) + ßxrighl (n) + xx center (n) 'a,, ß and g are i the remaining section set to 1.0 for simplicity, but they can be set to arbitrary values. the a, ß and x values can either be constant or depend on the signal contents to emphasize one or two channels to obtain an optimal quality.

Den normaliserade korskorrelationen mellan mono- och mittensignalen beräknas såsom: där frameend _ Rcc = í E xcenlrv (n lxcenlre (n) n=frames1ari frameend _ Rmrn = I: E xmono (n)xmono (n) n =finmestarl frameend _ Rem = í 2 xcemne (roxmnnr: (n) ' n=fi1zme slarv 10 15 20 25 527 670 23 xcem är mittensignalen och xmm år monosignalen. Monosignalen kommer från monomålsignalen men det är möjligt att även använda monokodarens lokala syntetisering.The normalized cross-correlation between the mono and center signal is calculated as: where frameend _ Rcc = í E xcenlrv (n lxcenlre (n) n = frames1ari frameend _ Rmrn = I: E xmono (n) xmono (n) n = fi nmestarl frameend _ Rem = í 2 xcemne (roxmnnr: (n) 'n = fi1 zme negligence 10 15 20 25 527 670 23 xcem is the center signal and xmm is the mono signal.

Mittenrestsignalen som ska kodas år: xcenlre rcsidual (n) = xcenlre (n) _ g Q 'x mono (n) _ R gß = Q! (24%))- Qg år en kvantiseringsfunktion som ska appliceras på balansfaktorn.The center residual signal to be coded is: xcenlre rcsidual (n) = xcenlre (n) _ g Q 'x mono (n) _ R gß = Q! (24%)) - Qg is a quantization function to be applied to the balance factor.

Balansfaktorn överförs på överföringskanalen.The balance factor is transmitted on the transmission channel.

Om EC är kodningsfunktionen (t.ex. en transformkodare) för mittenrest- signalen och Em är kodningsfunktionen för monosignalen kan då den avkodade xjem, -signalen i avkodaren beskrivas som: n _ :r v: xcentre (n ) '_ g Q xmono (n) + x centre residual (n) I ___ -l xcenlrefesidual _ E: c (xcenlre residual xrçiana = E: (Em (xmonn Sidorestsignalen som ska kodas är: x side residual (n) = (xleji (n) _ xrighr (n _ gQrm xrzrnno (n) _ gQsc xzenlre (n ) 1 där gQm och ggn är kvantiserade värden av de parametrar gm och gu som minimerar uttrycket: frame end (xlcfl (n) _ xrighl _ gsmxgnna (n) _ gxrxzenlre ' n=framesrarr 10 15 20 25 30 527 670 24 17 kan till exempel vara lika med 2 för en minsta-kvadrat-minimering av felet. gm- och gR -parametrarna kan kvantiseras tillsammans eller separat.If EC is the coding function (eg a transform encoder) for the center residual signal and Em is the coding function for the mono signal, then the decoded xjem, signal in the decoder can be described as: n _: rv: xcentre (n) '_ g Q xmono ( n) + x center residual (n) I ___ -l xcenlrefesidual _ E: c (xcenlre residual xrçiana = E: (Em (xmonn The residual signal to be coded is: x side residual (n) = (xleji (n) _ xrighr ( n _ gQrm xrzrnno (n) _ gQsc xzenlre (n) 1 where gQm and ggn are quantized values of the parameters gm and gu that minimize the expression: frame end (xlc fl (n) _ xrighl _ gsmxgnna (n) _ gxrxzenlre 'n = framesrarr 10 15 20 25 30 527 670 24 17 can, for example, be equal to 2 for a least squares minimization of the error, the gm and gR parameters can be quantized together or separately.

Om E, är sidorestsignalens kodningsfunktion ges då de avkodade xfefl- och xflgh, -kanalssignalerna som: xlïfi (n) = xrfrono (n) _ xgenlrc (n) + xxïde (n) xííghl (n) = 'xr';1ono(n) _ 'xzenlre (n) _ 'xš-'ide (n) xšde (n) = 'xçlkierexídual + gQsm xrçronf: (n ) + gQscxgenlre (n) n _ -l xsideresidual _ E: .r (xslderexizlunl ' En av de perceptionsartefakter som är mest störande är för-eko-effekten. I fig. 7a-b illustrerar diagram en sådan artefakt. Antag en signalkomponent som har den tidsutveckling som visas av kurva 100. I början, med start från tO finns signalkomponenten inte närvarande i ljudsamplet. Vid en tid t mellan t1 och t2 uppträder plötsligt signalkomponenten. Når signal- komponenten kodas med användning av en ramlångd av t2-t1 kommer signalkomponentens inträffande att "smetas ut" över hela ramen, såsom indikeras i kurva 101. Om en avkodning av kurvan 101 äger rum uppträder signalkomponenten en tid At före signalkomponentens avsedda uppträdande, och ett "för-eko" upplevs.If E, is the coding function of the residual signal, then the decoded xfe fl and x fl gh, channel signals are given as: xlï fi (n) = xrfrono (n) _ xgenlrc (n) + xxïde (n) xííghl (n) = 'xr'; 1ono (n ) _ 'xzenlre (n) _' xš-'ide (n) xšde (n) = 'xçlkierexídual + gQsm xrçronf: (n) + gQscxgenlre (n) n _ -l xsideresidual _ E: .r (xslderexizlunl' En av the most disturbing perceptual artifacts are the pre-echo effect.In fi g. 7a-b diagram illustrates such an artifact, assume a signal component having the time evolution shown by curve 100. In the beginning, starting from tO, the signal component is not present in At a time t between t1 and t2, the signal component suddenly appears.When the signal component is encoded using a frame length of t2-t1, the occurrence of the signal component will be "smeared" over the entire frame, as indicated in curve 101. If a decoding of curve 101 takes place, the signal component appears a time föret before the intended behavior of the signal component, and a "pre-echo" is experienced.

För-eko-artefakterna blir mer betonade om långa kodningsramar används.The pre-eco-artifacts become more emphasized if long coding frames are used.

Genom att använda kortare ramar undertrycks artefakten något. Ett annat sätt att handha de för-eko-problem som beskrivs ovan är att utnyttja det faktum att monosignalen finns tillgänglig vid både kodar- och avkodaränden.By using shorter frames, the artifact is somewhat suppressed. Another way of dealing with the pre-echo problems described above is to take advantage of the fact that the mono signal is available at both the encoder and decoder ends.

Detta gör det möjligt att skala sidosignalen enligt monosignalens energi- kontur. I avkodarånden utförs den inversa skalningen och en del av för-eko- problemen kan alltså mildras.This makes it possible to scale the side signal according to the energy contour of the mono signal. In the decoder spirit, the inverse scaling is performed and some of the pre-echo problems can thus be mitigated.

En energikontur för monosignalen beräknas över ramen såsom: 10 15 20 25 527 670 25 m+L Ec(m) =[ zw(n)xf,w,m(n):\, frame start S m S frame end , n=m-L där w(n) år en fönsterbildande funktion. Den enklaste fönsterbildande funktionen är ett rektangulärt fönster, men andra fönstertyper såsom ett Hamming-fönster kan vara mer önskvärt.An energy contour of the mono signal is calculated over the frame such as: 10 15 20 25 527 670 25 m + L Ec (m) = [zw (n) xf, w, m (n): \, frame start S m S frame end, n = mL where w (n) is a window-forming function. The simplest window-forming function is a rectangular window, but other window types such as a Hamming window may be more desirable.

Sidorestsignalen skalas då som: side resulual (n ) x ¿_,,de,e_,,,,uu,(n) = W , frame start S n S frame end .The page residual signal is then scaled as: page resultual (n) x ¿_ ,, de, e _ ,,,, uu, (n) = W, frame start S n S frame end.

L' I en mer generell form kan ekvationen ovan skrivas såsom: gc__\_,.de,e_,,d,,a, (n) = frame start S n S frame end , där f år en monoton kontinuerlig funktion. I avkodaren beräknas energikonturen på den avkodade monosignalen och appliceras på den avkodade sidosignalen som: än* (n) = xfw (n) f (E, (n)), framestart S n S frame end .In a more general form, the above equation can be written as: gc __ \ _ ,. de, e _ ,, d ,, a, (n) = frame start S n S frame end, where f is a monotonic continuous function. In the decoder, the energy contour of the decoded mono signal is calculated and applied to the decoded side signal as: than * (n) = xfw (n) f (E, (n)), frame start S n S frame end.

Eftersom denna energikonturskalning på något sätt år ett alternativ till användningen av kortare ramlångder år detta koncept särskilt väl låmpat att kombineras med konceptet med variabel ramlängd, beskrivet vidare ovan.Since this energy contour scaling is in some way an alternative to the use of shorter frame lengths, this concept is particularly well suited to be combined with the concept of variable frame length, described further above.

Genom att ha vissa kodningsscheman som tillämpar energikonturskalning, vissa som inte gör det och vissa som tillämpar energikonturskalning endast under vissa delramar, kan en flexiblare uppsättning av kodningsscheman tillhandahållas. I ñg. 8 illustreras en utföringsform av en signalkodarenhet 30 enligt den föreliggande uppfinningen. Här innefattar de olika 10 15 20 25 30 527 670 26 kodningsschemana 81 streckade delramar 91, vilka representerar kodning som tillämpar energikonturskalningen och icke streckade delramar 92, vilka representerar kodningsprocedurer som inte tillämpar energikontur- skalningen. På detta sätt är kombinationer inte endast av delramar av olika längder utan även av delramar med skiftande kodningsprinciper tillgängliga.By having certain coding schemes that apply energy contour scaling, some that do not, and some that apply energy contour scaling only under certain subframes, a more flexible set of coding schemes can be provided. I ñg. 8, an embodiment of a signal encoder unit 30 according to the present invention is illustrated. Here, the various coding schemes 81 include dashed subframes 91, which represent coding that apply the energy contour scaling, and non-dashed subframes 92, which represent coding procedures that do not apply the energy contour scaling. In this way, combinations of not only subframes of different lengths but also of subframes with varying coding principles are available.

I det föreliggande förklarande exemplet skiljer sig tillämpningen av energikonturskalning mellan olika kodningsscheman. I ett mera allmänt fall kan vilka kodningsprinciper som helst kombineras med konceptet med variabel längd på ett analogt sätt.In the present explanatory example, the application of energy contour scaling differs between different coding schemes. In a more general case, any coding principles can be combined with the variable length concept in an analogous manner.

Uppsättningen av kodningsscheman i fig. 8 innefattar scheman som hanterar t.ex. för-eko-artefakter på olika sätt. I vissa scheman används längre delramar med för-eko-minimering enligt energikonturprincipen. I andra scheman utnyttjas kortare delramar utan energikonturskalning.The set of coding schemes in fi g. 8 includes schedules that handle e.g. for-eco-artifacts in different ways. In some schemes, longer subframes with pre-eco-minimization are used according to the energy contour principle. In other schemes, shorter subframes without energy contour scaling are used.

Beroende på signalinnehållet kan ett av alternativen vara mer fördelaktigt.Depending on the signal content, one of the options may be more advantageous.

För mycket allvarliga för-eko-fall kan kodningsscheman som utnyttjar korta ramar med energikonturskalning vara nödvändiga.For very severe pre-eco-cases, coding schemes utilizing short frames with energy contour scaling may be necessary.

Den föreslagna lösningen kan användas i hela frekvensbandet eller i en eller flera distinkta delband. Användningen av delband kan tillämpas antingen på både huvud- och sidosignalerna, eller på en av dem separat. En föredragen utföringsform innefattar en uppdelning av sidosignalen i flera frekvensband.The proposed solution can be used in the whole frequency band or in one or more distinct subbands. The use of subbands can be applied either to both the main and side signals, or to one of them separately. A preferred embodiment comprises a division of the side signal into several frequency bands.

Orsaken är helt enkelt att det är enklare att avlägsna den möjliga redundansen i ett isolerat frekvensband än i hela frekvensbandet. Detta är särskilt viktigt vid kodning av musiksignaler med rikt spektralt innehåll.The reason is simply that it is easier to remove the possible redundancy in an isolated frequency band than in the entire frequency band. This is especially important when encoding music signals with rich spectral content.

En möjlig användning är att koda frekvensbandet under en förutbestämd tröskel med det ovanstående förfarandet. Den förutbestämda tröskeln kan företrädesvis vara 2 kHz eller änne mer företrädesvis 1 kHz. För den återstående delen av frekvensområdet av intresse kan man antingen koda ett annat tillkommande frekvensband med det ovanstående förfarandet eller använda ett fullständigt annat förfarande. 10 15 20 25 30 » 527 670 27 Ett motiv till att använda det ovanstående förfarandet företrädesvis för låga frekvenser är att diffusa ljudfält allmänt sett har litet energiinnehåll vid höga frekvenser. Den naturliga orsaken är att ljudabsorption typiskt sett ökar med frekvens. Dessutom verkar de diffusa ljudfältskomponenterna spela en mindre viktig roll för det mänskliga ljudsystemet vid högre frekvenser. Därför är det fördelaktigt att använda denna lösning vid låga frekvenser (under l eller 2 kHz) och lita till andra, ännu mer biteffektiva kodningsscheman vid högre frekvenser. Det faktum att schemat endast tillämpas vid låga frekvenser ger en stor inbesparing i bithastighet eftersom den nödvändiga bithastigheten med det föreslagna förfarandet är proportionell mot den fordrade bandbredden. I de flesta fall kan monokodaren koda hela frekvensbandet, medan den föreslagna sidosignalskodningen föreslås utföras endast i den nedre delen av frekvensbandet, såsom schematiskt illustreras av ñg. 9. Referenssiffra 301 hänvisar till ett kodningsschema enligt den föreliggande uppfinningen för sídosignalen, referenssiffra 302 hänvisar till andra kodningsscheman för sidosignalen och referenssiffra 303 hänvisar till ett kodningsschema för sidosignalen.One possible use is to encode the frequency band below a predetermined threshold with the above method. The predetermined threshold may preferably be 2 kHz or even more preferably 1 kHz. For the remaining part of the frequency range of interest, one can either encode another additional frequency band with the above method or use a completely different method. A motive for using the above method, preferably for low frequencies, is that diffuse sound fields generally have a low energy content at high frequencies. The natural reason is that sound absorption typically increases with frequency. In addition, the diffuse sound field components seem to play a less important role for the human sound system at higher frequencies. Therefore, it is advantageous to use this solution at low frequencies (below 1 or 2 kHz) and rely on other, even more bit-efficient coding schemes at higher frequencies. The fact that the scheme is only applied at low frequencies provides a large saving in bit rate because the required bit rate with the proposed method is proportional to the required bandwidth. In most cases, the monocoder may encode the entire frequency band, while the proposed side signal coding is proposed to be performed only in the lower part of the frequency band, as schematically illustrated by ñg. Reference numeral 301 refers to a coding scheme according to the present invention for the side signal, reference numeral 302 refers to other coding schemes for the side signal, and reference numeral 303 refers to a coding scheme for the side signal.

Det finns också den möjligheten att använda det föreslagna förfarandet för flera distinkta frekvensband.There is also the possibility of using the proposed method for several distinct frequency bands.

I fig. 10 illustreras huvudstegen för en utföringsform av ett kodnings- förfarande enligt den föreliggande uppfinningen som ett flödesdiagram.I fi g. 10, the main steps of an embodiment of an encoding method according to the present invention are illustrated as a fate diagram.

Proceduren börjar i steg 200. I steg 210 kodas en huvudsignal härledd från de polyfoniska signalerna. I steg 212 tillhandahålls kodningsscheman, vilka innefattar delramar med olika längder och/ eller ordning. En sidosignal som härleds i steg 214 från de polyfoniska signalerna kodas genom ett kodningsschema som beror åtminstone delvis på de föreliggande polyfoniska signalernas faktiska signalinnehåll. Proceduren slutar i steg 299.The procedure begins in step 200. In step 210, a main signal derived from the polyphonic signals is encoded. In step 212, coding schemes are provided, which include subframes of different lengths and / or order. A side signal derived in step 214 from the polyphonic signals is encoded by a coding scheme which depends at least in part on the actual signal content of the present polyphonic signals. The procedure ends in step 299.

I flg. ll illustreras huvudstegen för en utföringsform av ett avkodningsförfarande enligt den föreliggande uppfinningen som ett flödesdiagram. Proceduren börjar i steg 200. I steg 220 avkodas en mottagen 10 15 20 527 670 28 kodad huvudsignal. I steg 222 tillhandahålls kodningsscheman, vilka innefattar delramar med olika längder och/ eller ordning. En mottagen sidosignal avkodas i steg 224 genom ett utvalt kodningsschema. I steg 226 kombineras de avkodade huvud- och sidosignalema till en polyfonisk signal.I fl g. 11, the main steps of an embodiment of a decoding method according to the present invention are illustrated as a fate diagram. The procedure begins in step 200. In step 220, a received coded master signal is decoded. In step 222, coding schemes are provided, which include subframes of different lengths and / or order. A received side signal is decoded in step 224 by a selected coding scheme. In step 226, the decoded main and side signals are combined into a polyphonic signal.

Proceduren slutari steg 299.The procedure closed step 299.

Utföringsformerna som beskrivs ovan ska förstår som några illustrativa exempel av den föreliggande uppfinningen. Det inses av fackmannen att olika modifieringar, kombinationer och ändringar kan göras på utföringsformema utan att avlägsna sig från den föreliggande uppfinningens omfång. I synnerhet kan olika dellösningar i de olika utföringsformerna kombineras i andra uppställningar, där det så är tekniskt möjligt. Den föreliggande uppfinningens omfång definieras emellertid av de medföljande kraven.The embodiments described above are to be understood as some illustrative examples of the present invention. It will be appreciated by those skilled in the art that various modifications, combinations and changes may be made to the embodiments without departing from the scope of the present invention. In particular, different sub-solutions in the different embodiments can be combined in other arrangements, where this is technically possible. However, the scope of the present invention is defined by the appended claims.

REFERENSER Europeiskt patent 0497413 US patent 5,285,498 US patent 5,434,948 "Binaural cue coding applied to stereo and multi~channel audio compression", 112th AES convention, maj 2002, München, Tyskland av C.REFERENCES European Patent 0497413 U.S. Patent 5,285,498 U.S. Patent 5,434,948 "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES Convention, May 2002, Munich, Germany by C.

Faller et al.Faller et al.

Claims (26)

10 15 20 25 30 527 670 29 PATENTKRAV10 15 20 25 30 527 670 29 PATENT REQUIREMENTS 1. Ett förfarande för kodning av polyfoniska signaler, innefattande stegen: generering (210) av en första utsignal (pmono), Vilken ål' kodningsparametrar som representerar en huvudsignal som baserar sig på signaler för åtminstone en första och en andra kanal (a, b; L, R); och generering (214) av en andra utsignal (psidc), vilken är kodningsparametrar som representerar en sidosignal som baserar sig på signaler för åtminstone den första och den andra kanalen (a, b; L, R) inom en kodningsram (80), kännetecknat av det ytterligare steget: tillhandahållande (212) av åtminstone två kodningsscheman (81), vart och ett av de åtminstone två kodningsschemana kännetecknas av en respektive uppsättning av delramar (90) som tillsammans utgör kodningsramen (80), varvid summan av delramarnas (90) längder i varje kodningsschema är lika med kodníngsramens (80) längd; varje uppsättning av delramar (90) innefattar åtminstone en delram (90): varvid steget generering (214) av den andra utsignalen (psme) innefattar steget att välja ut ett kodningsschema (81) åtminstone till en del beroende på den föreliggande sidosignalens (xsme) signalinnehåll; varvid den andra utsignalen (psfde) kodas i var och en av delramarna (90) i den utvalda uppsättningen av delramar (90) separat.A method of encoding polyphonic signals, comprising the steps of: generating (210) a first output signal (pmono), which eel 'encoding parameters representing a main signal based on signals for at least a first and a second channel (a, b). ; L, R); and generating (214) a second output signal (psidc), which are coding parameters representing a side signal based on signals for at least the first and second channels (a, b; L, R) within a coding frame (80), characterized of the further step: providing (212) at least two coding schemes (81), each of the at least two coding schemes being characterized by a respective set of subframes (90) which together form the coding frame (80), the sum of the subframes (90) lengths in each coding scheme are equal to the length of the coding frame (80); each set of subframes (90) comprises at least one subframe (90): the step of generating (214) the second output signal (psme) comprises the step of selecting an encoding scheme (81) at least in part depending on the present side signal (xsme) signal content; wherein the second output signal (psfde) is encoded in each of the subframes (90) in the selected set of subframes (90) separately. 2. Ett förfarande enligt patentkrav 1, kännetecknat av att steget generering (214) av den andra utsignalen (psme) i sin tur innefattar stegen: generering av kodningsparametrar som representerar en sidosignal (xside), vilken är en första linjärkombination av signaler från åtminstone den första och den andra kanalen (a, b; L, R), inom alla delramar (90) för var och en av de åtminstone två uppsåttningarna av delramar (90) separat; beräkning av ett totalt naturtrogenhetsmått för vart och ett av de åtminstone två kodningsschemana (8l); samt 10 15 20 25 30 527 670 30 utväljande av kodningssignalen från det kodningsschema (81) som har det bästa naturtrogenhetsmåttet såsom de kodningsparametrar (psiae) som representerar sidosignalen.A method according to claim 1, characterized in that the step of generating (214) the second output signal (psme) in turn comprises the steps of: generating coding parameters representing a side signal (xside), which is a first linear combination of signals from at least the first and second channels (a, b; L, R), within all subframes (90) for each of the at least two sets of subframes (90) separately; calculating a total measure of natural fidelity for each of the at least two coding schemes (81); and selecting the coding signal from the coding scheme (81) which has the best measure of fidelity to nature such as the coding parameters (psiae) representing the side signal. 3. Ett förfarande enligt patentkrav 2, kännetecknat av att naturtrogenhetsmåttet grundar sig på ett signal-till-brus-mått.A method according to claim 2, characterized in that the measure of fidelity to nature is based on a signal-to-noise measure. 4. Ett förfarande enligt något av patentkraven 1 till 3, kännetecknat av att delramarna (90) har längder Isf enligt: l. där lf är kodningsramens (80) längd och n är ett heltal.A method according to any one of claims 1 to 3, characterized in that the subframes (90) have lengths Isf according to: 1. where lf is the length of the coding frame (80) and n is an integer. 5. Ett förfarande enligt patentkrav 4, kännetecknat av att n är mindre än ett förutbestämt värde.A method according to claim 4, characterized in that n is less than a predetermined value. 6. Ett förfarande enligt patentkrav 5, kännetecknat av att de åtminstone två kodningsschemana (81) innefattar alla permutationer av delramslångder (90).A method according to claim 5, characterized in that the at least two coding schemes (81) comprise all permutations of subframe lengths (90). 7. Ett förfarande enligt något av patentkraven 1 till 6, kännetecknat av att steget generering (210) av kodningsparametrar (pmom) som representerar huvudsignalen i sin tur innefattar stegen: skapande av en huvudsignal (Xmono) såsom en andra linjärkornbination av signaler från åtminstone den första och den andra kanalen (a, b; L, R); samt kodning av huvudsignalen till kodningsparametrar (pmom) som representerar huvudsignalen, varvid steget kodning av sidosignalen i sin tur innefattar stegen: skapande av en sidorestsignal (xsme fesiauai) såsom en differens mellan sidosignalen och huvudsignalen (xmono) skalad med en balansfaktor (gsm); 10 15 20 25 30 527 670 31 vilken balansfaktor (gsm) är bestämd såsom den faktor som minimerar sidorestsignalen enligt ett kvalitetskriteriurn; kodning av sidorestsignalen och balansfaktorn (gsm) som de kodningsparametrar (psme) som representerar sidosignalen.A method according to any one of claims 1 to 6, characterized in that the step of generating (210) coding parameters (pmom) representing the main signal in turn comprises the steps of: creating a main signal (Xmono) as a second linear grain combination of signals from at least the first and second channels (a, b; L, R); and encoding the main signal into coding parameters (pmom) representing the main signal, the step of encoding the side signal in turn comprising the steps of: creating a side residual signal (xsme fesiauai) as a difference between the side signal and the main signal (xmono) scaled by a balance factor (gsm); Which balance factor (gsm) is determined as the factor which minimizes the side residual signal according to a quality criterion; coding of the side residual signal and the balance factor (gsm) as the coding parameters (psme) representing the side signal. 8. Ett förfarande enligt patentkrav 7, kännetecknat av att kvalitetskriteriet grundar sig på ett minsta-kvadrat-mått.A method according to claim 7, characterized in that the quality criterion is based on a minimum square dimension. 9. Ett förfarande enligt något av patentkraven 1 till 8, kännetecknat av att steget kodning av sidosignalen vidare innefattar steget: skalning av sidosignalen (Xsidc) till en energikontur för huvudsignalen (xmm).A method according to any one of claims 1 to 8, characterized in that the step of encoding the side signal further comprises the step of: scaling the side signal (Xsidc) to an energy contour of the main signal (xmm). 10. Ett förfarande enligt patentkrav 9, kännetecknat av att skalningen av sidosignalen (xsme) är en division med en faktor som är en monoton kontinuerlig funktion av huvudsignalens (xmono) energikontur.A method according to claim 9, characterized in that the scaling of the side signal (xsme) is a division by a factor which is a monotonic continuous function of the energy contour of the main signal (xmono). 11. Ett förfarande enligt patentkrav 10, kännetecknat av att den monotona kontinuerliga funktionen är en kvadratrotsfunktion.A method according to claim 10, characterized in that the monotonic continuous function is a square root function. 12. Ett förfarande enligt patentkrav 10 eller ll, kânnetecknat av att huvudsignalens, xmm, , energikontur, EC , beräknas över en delram enligt: m+L EC (m) = í 2w(n)x,fm,,,, , framestart S m S frame end n=m-L där L är en godtycklig faktor, n är ett summeringsindex, m är samplet inom delramen och w(n) är en fönsterskapande funktion.A method according to claim 10 or 11, characterized in that the main signal, xmm,, energy contour, EC, is calculated over a subframe according to: m + L EC (m) = í 2w (n) x, fm ,,,,, front start S m S frame end n = mL where L is an arbitrary factor, n is a summation index, m is the sample within the subframe and w (n) is a window creating function. 13. Ett förfarande enligt patentkrav 12, kännetecknat av att den fönsterskapande funktionen är en rektangulär fönsterskapande funktion.A method according to claim 12, characterized in that the window-creating function is a rectangular window-creating function. 14. Ett förfarande enligt patentkrav 12, kännetecknat av att den fönsterskapande funktionen är en Hamming-fönsterfunktion. 10 15 20 25 30 527 670 32A method according to claim 12, characterized in that the window creating function is a Hamming window function. 10 15 20 25 30 527 670 32 15. Ett förfarande enligt något av patentkraven 1 till 14, kännetecknat av att de åtminstone två kodningsschernana (81) innefattar olika kodningsprinciper för sidosignalen (xside).A method according to any one of claims 1 to 14, characterized in that the at least two coding chips (81) comprise different coding principles for the side signal (xside). 16. Ett förfarande enligt patentkrav 15, kännetecknat av att åtminstone ett första kodningsschema av de åtminstone två kodningsschemana (81) innefattar en första kodningsprincip för sidosignalen (xside) för alla delramar (90) och åtminstone ett andra kodningsschema av de åtminstone två kodningsschemana (81) innefattar en andra kodningsprincip för sidosignalen (Xsme) för alla delramar (90).A method according to claim 15, characterized in that at least a first coding scheme of the at least two coding schemes (81) comprises a first coding principle of the side signal (xside) for all subframes (90) and at least a second coding scheme of the at least two coding schemes (81). ) includes a second coding principle for the side signal (Xsme) for all subframes (90). 17. Ett förfarande enligt patentkrav 15 eller 16, kännetecknat av att åtminstone ett kodningsschema av de åtminstone två kodningsschemana (81) innefattar den första kodningsprincipen för sidosignalen (xside) för en delram och den andra kodningsprincipen för sidosignalen (Xsme) för en annan delram.A method according to claim 15 or 16, characterized in that at least one coding scheme of the at least two coding schemes (81) comprises the first coding principle of the side signal (xside) for one subframe and the second coding principle of the side signal (Xsme) for another subframe. 18. Ett förfarande enligt patentkrav 1, kännetecknat av att steget generering (214) av den andra utsignalen (paus) i sin tur innefattar stegen: analysering av spektrala kännetecken för en sidosignal (xside), vilken är en första linjär kombination av signaler från åtminstone den första och den andra kanalen (a, b; L, R); utväljande av en uppsättning delramar (90) grundat på de analyserade spektrala kännetecknen; samt kodning av sidosignalen (xside) inom alla delramar (90) i den utvalda uppsättningen av delramar (90) separat.A method according to claim 1, characterized in that the step of generating (214) the second output signal (pause) in turn comprises the steps of: analyzing spectral characteristics of a side signal (xside), which is a first linear combination of signals from at least the first and second channels (a, b; L, R); selecting a set of subframes (90) based on the analyzed spectral characteristics; and encoding the side signal (xside) within all subframes (90) in the selected set of subframes (90) separately. 19. Ett förfarande enligt något av patentkraven 1 till 18, kännetecknat av att steget generering (214) av en andra utsignal (psme) tillämpas i ett begränsat frekvensband.A method according to any one of claims 1 to 18, characterized in that the step generation (214) of a second output signal (psme) is applied in a limited frequency band. 20. Ett förfarande enligt patentkrav 19, kännetecknat av att steget generering (214) av en andra utsignal (pside) tillämpas endast för frekvenser under 2 kHz. 10 15 20 25 30 527 670 33A method according to claim 19, characterized in that the step generation (214) of a second output signal (pside) is applied only for frequencies below 2 kHz. 10 15 20 25 30 527 670 33 21. Ett förfarande enligt patentkrav 20, kännetecknat av att steget generering (214) av en andra utsignal (pside) tillämpas endast för frekvenser under 1 kl-Iz.A method according to claim 20, characterized in that the step of generating (214) a second output signal (pside) is applied only for frequencies below 1 kl-1z. 22. Ett förfarande enligt något av patentkraven 1 till 21, kännetecknat av att de polyfona signalerna representerar musiksignaler.A method according to any one of claims 1 to 21, characterized in that the polyphonic signals represent music signals. 23. Ett förfarande för avkodning av polyfona signaler, innefattande stegen: avkodning (220) av kodningsparametrar (pmono) som representerar en huvudsignal; avkodning (224) av kodningsparametrar (psme) som representerar en sidosignal inom en kodningsram (80); samt kombinering (226) av åtminstone den avkodade huvudsignalen (x"m0n<>) och den avkodade sidosignalen (xkide) till signaler för åtminstone en första och en andra kanal (a, b; L, R), kännetecknat av steget: tillhandahållande (222) av åtminstone två kodningsscheman (81), vart och ett av de åtminstone två kodningsschemana (81) kännetecknas av en uppsättning av delramar (90) som tillsammans utgör kodningsramen (80), varvid summan av delramarnas (90) längder i varje kodningsschema (81) är lika med kodningsramens (80) längd; varvid varje uppsättning av delramar (90) innefattar åtminstone en de1ram(90), varvid steget avkodning (224) av de kodningsparametrar (psme) som representerar sidosignalen i sin tur innefattar steget avkodning av de kodningsparametrar (pside) som representerar sidosignalen separat i delramarna (90) för ett av de åtminstone två kodningsschemana (81).A method of decoding polyphonic signals, comprising the steps of: decoding (220) encoding parameters (pmono) representing a main signal; decoding (224) encoding parameters (psme) representing a side signal within an encoding frame (80); and combining (226) the at least the decoded main signal (x "m0n <>) and the decoded side signal (xkide) into signals for at least a first and a second channel (a, b; L, R), characterized by the step: providing ( 222) of at least two coding schemes (81), each of the at least two coding schemes (81) being characterized by a set of subframes (90) which together form the coding frame (80), the sum of the lengths of the subframes (90) in each coding scheme ( 81) is equal to the length of the coding frame (80), each set of subframes (90) comprising at least one subframe (90), the step of decoding (224) the coding parameters (psme) representing the side signal in turn comprising the step of decoding the coding parameters (pside) representing the side signal separately in the subframes (90) of one of the at least two coding schemes (81). 24. Kodningsapparat (14), innefattande: ingångsorgan (16; 16A-C) för polyfona signaler (a, b; L, R, C) som innefattar åtminstone en första och en andra kanal (a, b; L, R), 10 15 20 25 30 527 670 34 organ (38) för generering av en första utsignal (pmono) som är kodníngsparametrar som representerar en huvudsignal som grundar sig på signaler från åtminstone den första och den andra kanalen (a, b; L, R); och organ (38) för generering av en andra utsignal (pside) som år kodningsparametrar som representerar en sidosignal som grundar sig på signaler från åtminstone den första och den andra kanalen (a, b; L, R) inom en kodningsram (80); samt utgångsorgan (52); kännetecknar! av organ för tillhandahållande av åtminstone två kodningsscheman (81), vart och ett av de åtminstone två kodningsschemana (81) kännetecknas av en respektive uppsättning av delramar (90) som tillsammans utgör kodningsramen (80), varvid summan av delramarnas (90) längder i varje kodningsschema (81) är lika med kodningsramens (80) längd; varje uppsättning av delramar (90) innefattar åtminstone en delram (90): varvid organet (30) för generering av den andra utsignalen (pside) i sin tur innefattar organ (86, 87) för att välja ut ett kodningsschema (81) åtrninstone till en del beroende på den föreliggande sidosignalens (xsme) signalinnehåll; organ för kodning av sidosignalen (Xsme) i var och en av delramarna (90) i det utvalda kodningsschemat separat.An encoding apparatus (14), comprising: input means (16; 16A-C) for polyphonic signals (a, b; L, R, C) comprising at least a first and a second channel (a, b; L, R), 527 670 34 means (38) for generating a first output signal (pmono) which are coding parameters representing a main signal based on signals from at least the first and the second channel (a, b; L, R) ; and means (38) for generating a second output signal (pside) which are coding parameters representing a side signal based on signals from at least the first and second channels (a, b; L, R) within a coding frame (80); and output means (52); characteristics! means for providing at least two coding schemes (81), each of the at least two coding schemes (81) being characterized by a respective set of subframes (90) which together form the coding frame (80), the sum of the lengths of the subframes (90) in each coding scheme (81) is equal to the length of the coding frame (80); each set of subframes (90) comprises at least one subframe (90): the means (30) for generating the second output signal (pside) in turn comprises means (86, 87) for selecting a coding scheme (81) at least to a portion depending on the signal content of the present side signal (xsme); means for encoding the side signal (Xsme) in each of the subframes (90) of the selected encoding scheme separately. 25. Avkodarapparat (24), innefattande: ingångsorgan (54) för kodningsparametrar (pmom) som representerar en huvudsignal och kodningsparametrar (pside) som representerar en sidosignal; organ (64) för avkodning av de kodningsparametrar (pmono) som representerar huvudsignalen; organ (60) för avkodning av de kodningsparametrar (pslde) som representerar sidosignalen inom en kodningsram (80); och organ (68, 70) för kombinering av åtminstone den avkodade huvudsignalen (x“m0n°) och den avkodade sidosignalen (xäide) till signaler för åtminstone en första och en andra kanal (a, b; L, R); samt 10 15 20 527 670 35 utgångsorgan (26; 26A-C), kännetecknar! av att organet (60) för avkodning av de kodningsparametrar (pi-ide) som representerar sidosignalen i sin tur innefattar: organ för tillhandahållande av åtminstone två. kodningsscheman (81), vart och ett av de åtminstone två kodningsschemana (81) kännetecknas av en respektive uppsättning av delramar (90) som tillsammans utgör kodningsramen (80), varvid summan av delramarnas (90) längder i varje kodningsschema är lika med kodningsramens (80) längd; varvid varje uppsättning av delramar (90) innefattar åtminstone en delram (90); samt organ för avkodning av de kodningsparametrar (pside) som representerar sidosignalen separat i delramarna (90) för en av de åtminstone två kodningsschemana (81).A decoder apparatus (24), comprising: input means (54) for coding parameters (pmom) representing a main signal and coding parameters (pside) representing a side signal; means (64) for decoding the coding parameters (pmono) representing the main signal; means (60) for decoding the encoding parameters (pslde) representing the side signal within an encoding frame (80); and means (68, 70) for combining at least the decoded main signal (x "m0n °) and the decoded side signal (xide) into signals for at least a first and a second channel (a, b; L, R); and output means (26; 26A-C), characterize! in that the means (60) for decoding the coding parameters (pi-ide) representing the side signal in turn comprises: means for providing at least two. coding schemes (81), each of the at least two coding schemes (81) being characterized by a respective set of subframes (90) which together form the coding frame (80), the sum of the lengths of the subframes (90) in each coding scheme being equal to the coding frame ( 80) length; each set of subframes (90) comprising at least one subframe (90); and means for decoding the coding parameters (pside) representing the side signal separately in the subframes (90) of one of the at least two coding schemes (81). 26. Ljudsystem (1) innefattande åtminstone ett av: en kodningsapparat (14) enligt krav 24, och en avkodningsapparat (24) enligt krav 25.A sound system (1) comprising at least one of: a coding apparatus (14) according to claim 24, and a decoding apparatus (24) according to claim 25.
SE0400417A 2003-12-19 2004-02-20 Natural fidelity optimized coding with variable frame length SE527670C2 (en)

Priority Applications (25)

Application Number Priority Date Filing Date Title
SE0400417A SE527670C2 (en) 2003-12-19 2004-02-20 Natural fidelity optimized coding with variable frame length
MXPA05012230A MXPA05012230A (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding.
PCT/SE2004/001867 WO2005059899A1 (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding
PL04820553T PL1623411T3 (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding
AU2004298708A AU2004298708B2 (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding
DE602004023240T DE602004023240D1 (en) 2003-12-19 2004-12-15 Coding and decoding of multi-channel sound signals based on a main and sub signal representation
BRPI0419281-8A BRPI0419281B1 (en) 2003-12-19 2004-12-15 METHODS OF ENCODING AND DECODING MULTI-CHANNEL SIGNALS AND, CODING AND DECODING DEVICES
BRPI0410856A BRPI0410856B8 (en) 2003-12-19 2004-12-15 methods of encoding and decoding multichannel signals, encoder apparatus, and decoder apparatus
AT04820553T ATE371924T1 (en) 2003-12-19 2004-12-15 FIDELITY-OPTIMIZED CODING WITH VARIABLE FRAME LENGTH
RU2005134365/09A RU2305870C2 (en) 2003-12-19 2004-12-15 Alternating frame length encoding optimized for precision
CN200710138487XA CN101118747B (en) 2003-12-19 2004-12-15 Fidelity-optimized pre echoes inhibition encoding
CA2527971A CA2527971C (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding
EP04820553A EP1623411B1 (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding
DE602004008613T DE602004008613T2 (en) 2003-12-19 2004-12-15 TREUE OPTIMIZED CODING WITH VARIABLE FRAME LENGTH
EP07109801A EP1845519B1 (en) 2003-12-19 2004-12-15 Encoding and decoding of multi-channel audio signals based on a main and side signal representation
JP2006518596A JP4335917B2 (en) 2003-12-19 2004-12-15 Fidelity optimized variable frame length coding
AT07109801T ATE443317T1 (en) 2003-12-19 2004-12-15 CODING AND DECODING OF MULTI-CHANNEL SIGNALS BASED ON A MAIN AND SECONDARY SIGNAL REPRESENTATION
ZA200508980A ZA200508980B (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding
CNB2004800186630A CN100559465C (en) 2003-12-19 2004-12-15 The variable frame length coding that fidelity is optimized
CA2690885A CA2690885C (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding
US11/011,765 US7809579B2 (en) 2003-12-19 2004-12-15 Fidelity-optimized variable frame length encoding
HK06112026.7A HK1091585A1 (en) 2003-12-19 2006-11-01 Fidelity-optimised variable frame length encoding
HK08106066.8A HK1115665A1 (en) 2003-12-19 2006-11-01 Fidelity-optimised pre-echo suppressing encoding
RU2007121143/09A RU2425340C2 (en) 2003-12-19 2007-06-05 Accuracy-optimised encoding with supression of lead echo
JP2007216374A JP4589366B2 (en) 2003-12-19 2007-08-22 Fidelity optimized variable frame length coding

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0303501A SE0303501D0 (en) 2003-12-19 2003-12-19 Filter-based parametric multi-channel coding
SE0400417A SE527670C2 (en) 2003-12-19 2004-02-20 Natural fidelity optimized coding with variable frame length

Publications (3)

Publication Number Publication Date
SE0400417D0 SE0400417D0 (en) 2004-02-20
SE0400417L SE0400417L (en) 2005-06-20
SE527670C2 true SE527670C2 (en) 2006-05-09

Family

ID=31996354

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0400417A SE527670C2 (en) 2003-12-19 2004-02-20 Natural fidelity optimized coding with variable frame length

Country Status (15)

Country Link
EP (2) EP1845519B1 (en)
JP (2) JP4335917B2 (en)
CN (2) CN100559465C (en)
AT (2) ATE443317T1 (en)
AU (1) AU2004298708B2 (en)
BR (2) BRPI0419281B1 (en)
CA (2) CA2527971C (en)
DE (2) DE602004023240D1 (en)
HK (2) HK1091585A1 (en)
MX (1) MXPA05012230A (en)
PL (1) PL1623411T3 (en)
RU (2) RU2305870C2 (en)
SE (1) SE527670C2 (en)
WO (1) WO2005059899A1 (en)
ZA (1) ZA200508980B (en)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0305434B1 (en) * 2002-07-12 2017-06-27 Koninklijke Philips Electronics N.V. Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal
US8214220B2 (en) 2005-05-26 2012-07-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
JP4639966B2 (en) * 2005-05-31 2011-02-23 ヤマハ株式会社 Audio data compression method, audio data compression circuit, and audio data expansion circuit
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
AU2006266655B2 (en) 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1913578B1 (en) 2005-06-30 2012-08-01 LG Electronics Inc. Method and apparatus for decoding an audio signal
US8032368B2 (en) 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block swithcing and linear prediction coding
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
EP1938311B1 (en) 2005-08-30 2018-05-02 LG Electronics Inc. Apparatus for decoding audio signals and method thereof
US7987097B2 (en) 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
WO2007040353A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing
KR100857115B1 (en) 2005-10-05 2008-09-05 엘지전자 주식회사 Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
WO2007091927A1 (en) * 2006-02-06 2007-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Variable frame offset coding
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
EP2124486A1 (en) * 2008-05-13 2009-11-25 Clemens Par Angle-dependent operating device or method for generating a pseudo-stereophonic audio signal
KR101629862B1 (en) * 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
JPWO2010016270A1 (en) * 2008-08-08 2012-01-19 パナソニック株式会社 Quantization apparatus, encoding apparatus, quantization method, and encoding method
CN102160114B (en) * 2008-09-17 2012-08-29 法国电信公司 Method and device of pre-echo attenuation in a digital audio signal
JP5309944B2 (en) 2008-12-11 2013-10-09 富士通株式会社 Audio decoding apparatus, method, and program
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
EP2461321B1 (en) * 2009-07-31 2018-05-16 Panasonic Intellectual Property Management Co., Ltd. Coding device and decoding device
US8977546B2 (en) * 2009-10-20 2015-03-10 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device and method for both
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
CN102770913B (en) * 2009-12-23 2015-10-07 诺基亚公司 Sparse audio
US8442837B2 (en) 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
EP2544465A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
PL2922053T3 (en) * 2012-11-15 2019-11-29 Ntt Docomo Inc Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
US10060955B2 (en) * 2014-06-25 2018-08-28 Advanced Micro Devices, Inc. Calibrating power supply voltages using reference measurements from code loop executions
ES2955962T3 (en) 2015-09-25 2023-12-11 Voiceage Corp Method and system using a long-term correlation difference between the left and right channels for time-domain downmixing of a stereo sound signal into primary and secondary channels
CN107742521B (en) 2016-08-10 2021-08-13 华为技术有限公司 Coding method and coder for multi-channel signal
CN109215668B (en) * 2017-06-30 2021-01-05 华为技术有限公司 Method and device for encoding inter-channel phase difference parameters
CN115831130A (en) * 2018-06-29 2023-03-21 华为技术有限公司 Coding method, decoding method, coding device and decoding device for stereo signal
CN112233682B (en) * 2019-06-29 2024-07-16 华为技术有限公司 Stereo encoding method, stereo decoding method and device

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (en) * 1991-02-01 1992-09-01 Philips Nv SUBBAND CODING DEVICE, AND A TRANSMITTER EQUIPPED WITH THE CODING DEVICE.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5694332A (en) * 1994-12-13 1997-12-02 Lsi Logic Corporation MPEG audio decoding system with subframe input buffering
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5796842A (en) * 1996-06-07 1998-08-18 That Corporation BTSC encoder
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP3335605B2 (en) * 2000-03-13 2002-10-21 日本電信電話株式会社 Stereo signal encoding method
WO2002091363A1 (en) * 2001-05-08 2002-11-14 Koninklijke Philips Electronics N.V. Audio coding
JP2003084790A (en) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd Speech component emphasizing device
CN1219415C (en) * 2002-07-23 2005-09-14 华南理工大学 5.1 path surround sound earphone repeat signal processing method

Also Published As

Publication number Publication date
AU2004298708B2 (en) 2008-01-03
CN1816847A (en) 2006-08-09
JP2007529021A (en) 2007-10-18
EP1845519A3 (en) 2007-11-07
CA2690885C (en) 2014-01-21
RU2005134365A (en) 2006-05-27
CN101118747B (en) 2011-02-23
DE602004023240D1 (en) 2009-10-29
BRPI0410856B8 (en) 2019-10-15
EP1623411A1 (en) 2006-02-08
CA2527971A1 (en) 2005-06-30
SE0400417L (en) 2005-06-20
JP2008026914A (en) 2008-02-07
EP1623411B1 (en) 2007-08-29
EP1845519B1 (en) 2009-09-16
PL1623411T3 (en) 2008-01-31
ATE443317T1 (en) 2009-10-15
HK1115665A1 (en) 2008-12-05
ZA200508980B (en) 2007-03-28
RU2305870C2 (en) 2007-09-10
SE0400417D0 (en) 2004-02-20
CN100559465C (en) 2009-11-11
BRPI0410856A (en) 2006-07-04
EP1845519A2 (en) 2007-10-17
DE602004008613D1 (en) 2007-10-11
JP4335917B2 (en) 2009-09-30
CA2527971C (en) 2011-03-15
BRPI0419281B1 (en) 2018-08-14
BRPI0410856B1 (en) 2019-10-01
ATE371924T1 (en) 2007-09-15
HK1091585A1 (en) 2007-01-19
DE602004008613T2 (en) 2008-06-12
JP4589366B2 (en) 2010-12-01
CN101118747A (en) 2008-02-06
CA2690885A1 (en) 2005-06-30
AU2004298708A1 (en) 2005-06-30
RU2425340C2 (en) 2011-07-27
RU2007121143A (en) 2008-12-10
WO2005059899A1 (en) 2005-06-30
MXPA05012230A (en) 2006-02-10

Similar Documents

Publication Publication Date Title
SE527670C2 (en) Natural fidelity optimized coding with variable frame length
US7809579B2 (en) Fidelity-optimized variable frame length encoding
JP5455647B2 (en) Audio decoder
US7761290B2 (en) Flexible frequency and time partitioning in perceptual transform coding of audio
US20090204397A1 (en) Linear predictive coding of an audio signal
JP5773124B2 (en) Signal analysis control and signal control system, apparatus, method and program
EP2997572B1 (en) Audio object separation from mixture signal using object-specific time/frequency resolutions
JP5163545B2 (en) Audio decoding apparatus and audio decoding method
JP2008529056A (en) Adaptive bit allocation in multichannel speech coding.
KR20070088329A (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US8644526B2 (en) Audio signal decoding device and balance adjustment method for audio signal decoding device
RU2803142C1 (en) Audio upmixing device with possibility of operating in a mode with or without prediction
RU2798024C1 (en) Audio upmixing device performed with the possibility of operating in the mode with/without prediction
RU2799737C2 (en) Audio upmixing device with the possibility of operating in the mode with/without prediction
AU2007237227B2 (en) Fidelity-optimised pre-echo suppressing encoding