SE527713C2 - Kodning av polyfoniska signaler med villkorsbegränsade filter - Google Patents

Kodning av polyfoniska signaler med villkorsbegränsade filter

Info

Publication number
SE527713C2
SE527713C2 SE0400415A SE0400415A SE527713C2 SE 527713 C2 SE527713 C2 SE 527713C2 SE 0400415 A SE0400415 A SE 0400415A SE 0400415 A SE0400415 A SE 0400415A SE 527713 C2 SE527713 C2 SE 527713C2
Authority
SE
Sweden
Prior art keywords
filter
signal
channel
signals
parameters
Prior art date
Application number
SE0400415A
Other languages
English (en)
Other versions
SE0400415D0 (sv
SE0400415L (sv
Inventor
Anisse Taleb
Stefan Bruhn
Ingemar Johansson
Patrik Sandgren
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303499A external-priority patent/SE0303499D0/sv
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE0400415A priority Critical patent/SE527713C2/sv
Publication of SE0400415D0 publication Critical patent/SE0400415D0/sv
Priority to PL04809080T priority patent/PL1639580T3/pl
Priority to ES04809080.7T priority patent/ES2439693T3/es
Priority to JP2006518597A priority patent/JP4323520B2/ja
Priority to EP04809080.7A priority patent/EP1639580B1/en
Priority to PCT/SE2004/001907 priority patent/WO2005059901A1/en
Priority to EP12154099A priority patent/EP2456236A1/en
Priority to PT48090807T priority patent/PT1639580E/pt
Priority to DK04809080.7T priority patent/DK1639580T3/da
Priority to US11/011,764 priority patent/US7725324B2/en
Publication of SE0400415L publication Critical patent/SE0400415L/sv
Publication of SE527713C2 publication Critical patent/SE527713C2/sv

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Description

25 30 527 713 2 bearbetas de olika kanalernas signaler tillsammans, snarare än separat och individuellt. De två mest vanligt använda samstereokodningsteknikerna är kända som "Mitten/Sida"-stereokodning (M/S, eng. "Mid/Side") och intensitetsstereokodning, vilka vanligen tillämpas på delband av de stereo- eller multikanalssignaler som ska kodas.
M/ S-stereokodning liknar den beskrivna proceduren i stereo-FM-radio, på ett vis att den kodar och överför kanaldelbandens summa- och differenssignaler och därigenom utnyttjar redundans mellan kanaldelbanden. Strukturen och driften av en kodare som baserar sig på M/ S-stereokodning beskrivs, t.ex. i det amerikanska patentet US 5,285,498 av J .D. Johnston.
Intensitetsstereo å andra sidan klarar av att använda stereoirrelevans. Den överför kanalernas samlade intensitet (för de olika delbanden) tillsammans med viss lägesinformation som indikerar hur intensiteten är fördelad bland kanalerna. Intensitetsstereo tillhandahåller endast information om kanalernas spektrala storlek. Fasinformation forslas inte. Av denna orsak och eftersom tidsinterkanalsinformation (mer specifikt tidsdifferensen mellan kanalerna) är av stor psykoakustisk relevans särskilt vid lägre frekvenser kan intensitetsstereo endast användas vid höga frekvenser över t.ex. 2 kHz.
Ett intensitetsstereokodningsförfarande beskrivs t.ex. i det europeiska patentet EP 0497413 av R. Veldhuis et al.
Ett nyligen utvecklat stereokodningsförfarande beskrivs t.ex. i en konferenspublikation med titeln "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, maj 2002, München, Tyskland av C. Faller et al. Detta förfarande är ett parametriskt ljudkodningsförfarande för multikanaler. Grundprincipen är att kombinera insignalerna från N kanaler c1, cg, cN på kodningssidan till en monosignal m. Monosignalen ljudkodas genom användning av vilken konventionell monoljudkodek som helst. Parallellt härleds parametrar från kanalsignalerna, vilka beskriver multikanalsbilden. Parametrarna kodas och 10 15 20 25 30 527 713 3 översånds till avkodaren, tillsammans med ljudbitströmmen. Avkodaren avkodar först monosignalen m' och återskapar sedan kanalsignalerna c1', c2',..., cN' baserat på multikanalsbildens parameterbeskrivning.
Principen för förfarandet med binaural inpassningskodning (eng. Binaural Cue Coding) (BCC) är att den överför den kodade monosignalen och så kallade BCC-parametrar. BCC-parametrarna innefattar kodade interkanalsnivåskillnader och interkanalstidsdifferenser för delband av de ursprungliga multikanalsinsignalerna. Avkodaren återskapar de olika kanalsignalerna genom att tillämpa nivå- och fasjusteringar per delband av monosignalen baserat på BCC-parametrarna. Fördelen över t.ex. M / S- eller intensitetsstereo är att stereoinformationen som innefattar tidsmåssig interkanalinformation överförs vid mycket lägre bithastigheter.
Ett problem med de kodningstekniker för multikanaler enligt teknikens ståndpunkt som beskrivs ovan år att de fordrar höga bithastigheter för att tillhandahålla god kvalitet. Intensitetsstereo, om den tillämpas vid så låga bithastigheter som t.ex. endast några kbps, lider av det faktum att den inte tillhandahåller någon tidsrelaterad interkanalsinformation. Eftersom denna information år uppfattningsmåssigt viktig för låga frekvenser under t.ex. 2 kHz, klarar den inte av att tillhandahålla ett stereointryck vid sådana låga frekvenser.
BCC klarar av att återskapa multikanalsbilden även vid låga frekvenser vid låga bithastigheter av t.ex. 3 kbps eftersom den även överför tidsrelaterad interkanalsinformation. Denna teknik fordrar emellertid beräkningskråvande tid-frekvens-transfonner för var och en av kanalerna, både vid kodaren och avkodaren. Dessutom optimerar BCC avbildningen på ett rent matematiskt sätt. Kånnetecknande artefakter inneboende i kodningsförfarandet kommer emellertid inte att försvinna.
En annan teknik, beskriven i det amerikanska patentet US 5,434,948 av C.E. Holt et al., använder ett liknande angreppssätt för kodning av 10 15 20 25 30 527 713 \ 4 monosignalen och sidoinformation. I detta fall består sidoinformation av prediktorñlter och eventuellt en restsignal. Prediktorfiltren, estimerade genom en minsta-kvadrat-algoritrn, tillåter när de appliceras pà monosignalen prediktionen av multikanalsljudsignaler. Med denna teknik kan man nå mycket låga bithastigheter vid kodning av multikanalsljudkällor, emellertid på bekostnad av en kvalitetsförsämring.
Slutligen, för fullständigheten skull, måste en teknik nämnas som används i 3D-ljud. Denna teknik syntetiserar de högra och vänstra kanalsignalema genom filtrering av ljudkällesignaler med så kallade huvudrelaterade filter.
Denna teknik fordrar emellertid att de olika ljudkällesignalerna ska vara separerade och kan alltså inte allmänt tillämpas för stereo- eller multikanalskodning.
SAMMANFATTNING Även om prediktorfiltren är kända att vara optimala i en minsta-kvadrat- mening återskapar de inte alltid fullständigt de ursprungliga multikanalssignalernas förnimmelsekännetecken. I t.ex. fallet med stereokodning kan stereobildsinstabilitet inträffa, där ljudet hoppar slumpmässigt mellan vänster och höger. Vidare kan spektrala nollställen orsaka instabiliteter och leda till ett filter vars frekvenssvar vid dessa frekvenser är abnorm. Detta kan få filtret att utföra onödig förstärkning i vissa regioner och leda till mycket irriterande ljudliga artefakter, speciellt om signalerna är lâgpass- eller högpassfiltrerade.
Ett syfte med den föreliggande uppfinningen är att tillhandahålla ett förfarande och anordning för multikanalskodning som förbättrar den uppfattade kvaliteten för ljudsignalen. Ett ytterligare syfte med den föreliggande uppfinningen är att tillhandahålla ett sådant förfarande och en sådan anordning, vilka fordrar representation med låg bithastighet. 10 15 20 25 30 527 713 De ovanstående syftena ästadkoms genom förfaranden och anordningar enligt de bifogade patentkraven. Allmänt sett, kombineras signalerna för de olika kanalerna på kodningssidan till en huvudsignal. En uppsättning av filter, företrädesvis ett för varje kanal, härleds. När ett filter appliceras på huvudsignalen återskapar den signalen för den respektive kanalen under en förnimmelsevillkorsbegränsning. Förnimmelsevillkorsbegränsningen är en förstärknings- och/ eller formvillkorsbegränsning. Förstärkningsvillkors- begränsningen möjliggör bevarandet av den relativa energin mellan kanalerna medan formvillkorsbegränsningen möjliggör mer stabilitet genom att undvika onödig filtrering av spektrala nollställen. De överförda parametrarna är huvudsignalen, i kodad form, och filtrets parametrar, företrädesvis också kodade. Mottagaren återskapar de olika kanalernas signaler genom att applicera filtren och kanske viss tillkommande efterbearbetning.
En fördel med den föreliggande uppfinningen är att förnimmelseartefakter minskas när ljudsignaler avkodas. Den fordrade överföringsbithastigheten hålls även på samma gång på en mycket låg nivå.
KORT FIGURBESKRIVNING Uppfinningen, tillsammans med ytterligare syften och fördelar därmed förstås bäst genom hänvisning till den följande beskrivningen gjord tillsammans med de medföljande ritningarna, i vilka: FIG. 1 är ett blockdiagram av ett system för överföring av multikanalssignaler; FIG. 2a är ett blockdiagram av en utföringsform av en kodare i en sändare enligt den föreliggande uppfinningen; FIG. 2b är ett blockdiagram av en utföringsform av en avkodare i en mottagare enligt den föreliggande uppfinningen; FIG. 3a är ett blockdiagram av en annan utföringsform av en kodare i en sändare enligt den föreliggande uppfinningen; 10 15 20 25 30 527 713 6 FIG. 3b är ett blockdiagram av en annan utföringsform av en avkodare i en mottagare enligt den föreliggande uppñnningen; FIG. 4 är ett blockdiagram av en utföringsform av en filteranpassningsenhet enligt den föreliggande uppfinningen; FIG. 5 är diagram som illustrerar effekterna av otillräcklig reproduktion av sidosignaler i ett system enligt teknikens ståndpunkt; FIG. 6 är ett diagram som illustrerar effekter av spektrala nollställen i system enligt teknikens ståndpunkt; FIG. 7 är ett blockdiagram som illustrerar kombinationsmöjligheter i kanalfiltersektioner enligt den föreliggande uppfinningen; FIG. 8 är ett blockdiagram av en utföringsform av en kodare som utnyttjar partiell kombinerad kodning av en stereosignal; FIG. 9 är ett blockdiagram som illustrerar användningen av uppdelning i frekvensdelband; FIG. 10 är ett sammansatt diagram som illustrerar överlappande analys för kodning och avkodning; samt FIG. 11 är ett flödesdiagram av de grundläggande stegen av en utföringsform av ett kodningsförfarande enligt den föreliggande uppfinningen.
DET ALJERAD BESKRIVNING Fig. l illustrerar ett typiskt system 1, i vilket den föreliggande uppfinningen med fördel kan utnyttjas. En sändare 10 innefattar en antenn 12 inklusive därmed förknippad maskinvara och programvara för att kunna sända radiosignaler 5 till en mottagare 20. Sändaren 10 innefattar bland andra delar en multikanalskodare 14, vilken omvandlar signaler från ett antal ingångskanaler 16 till utsignaler som är lämpliga för radioöverföring.
Exempel på lämpliga multikanalskodare 14 beskrivs i detalj längre ner.
Ingångskanalernas 16 signaler kan tillhandahållas från t.ex. en ljudsignalslagringsenhet 18, såsom en datañl med digital representation av ljudinspelningar, magnetiska band- eller vinylskiveinspelningar av ljud etc. lngångskanalernas 16 signaler kan också tillhandahållas "levande", t.ex. 10 15 20 25 30 527 713 7 från en uppsättning av mikrofoner 19. Ljudsignalerna digitaliseras, om de inte redan år i digital form, innan de kommer in i multikanalskodaren 14.
På mottagarsidan 20 hanterar en antenn 22 med därmed förknippad maskinvara och programvara det faktiska mottagandet av de radiosignaler 5 som representerar polyfoniska ljudsignaler. Här utförs typiska funktionaliteter, såsom t.ex. felkorrigering. En avkodare 24 avkodar de mottagna radiosignalerna 5 och omvandlar det ljuddata som bärs därav till signaler för ett antal utgångskanaler 26. Utgångskanalerna kan tillhandahållas till t.ex. högtalare 29 för omedelbar presentation, eller kan lagras i ett ljudsignalsminne 28 av något slag.
Systemet 1 kan till exempel vara ett telefonkonferenssystem, ett system för att tillhandahålla ljudservice eller andra ljudtillämpningar. I vissa system, såsom t.ex. telefonkonferenssystemet måste kommunikationen vara av duplextyp, medan t.ex. distribution av musik från en servicetillhandahållare till en abonnent väsentligen kan vara av en envägstyp. Överföringen av signaler från sändaren 10 till mottagaren 20 kan också utföras med vilka andra medel som helst, t.ex. genom såväl olika typer av elektromagnetiska vågor, kablar eller fibrer som kombinationer därav.
Fig. 2a illustrerar en utföringsform av en multikanalskodare 14 enligt den föreliggande uppfinningen. Ett antal kanalsignaler c1, eg, ..., cN tas emot vid separate ingångar 16: 1-16:N.
Kanalsignalerna ansluts till en linjärkombinatíonsenhet 34. I den föreliggande utföringsformen summeras alla kanalsignalerna tillsammans för att bilda en monosignal x. Vilken förutbestämd linjärkombination som helst av en eller flera av kanalsignalerna kan emellertid användas som ett alternativ, inklusive rena kanalsignaler. En ren summa kommer emellertid att förenkla de flesta matematiska operationerna. Monosignalen x tillhandahålls som en insignal 42 till en kanalfiltersektion 130. Vidare tillhandahålls monosignalen x till, och kodas i, en monosignalskodare 38 för 1.0 15 20 25 30 527 713 I I 8 att tillhandahålla kodningsparametrar px som representerar monosignalen x.
Monosignalskodaren verkar enligt någon lämplig monosignalskodnings- teknik. Många sådana tekniker finns tillgängliga inom känd teknik. De faktiska detaljerna för kodningstekniken år inte av betydelse för att möjliggöra den föreliggande uppfinningen och diskuteras därför inte vidare.
Kanalsignalerna är också kopplade till kanalfiltersektionen 130. I den föreliggande utföringsformen, ansluts varje kanalsignal till en respektive ñlteranpassningsenhet 30:1-30:N. Filteranpassningsenheterna utför ett återskapande av en respektive kanalsignal när de appliceras på monosignalen x. Koefficienter för ñlteranpassningsenheterna 30:1-30:N optimeras enligt den föreliggande uppfinningen under en förnimmelsevillkorsbegränsning. Filteranpassningsenheternas 30:l-30:N optimerade koefñcienter kan också erhållas åtminstone delvis i en samoptimering av två eller flera av kanalsignalerna.
Kanalñltersektionens 130 utsignal innefattar N uppsättningar filter- parametrar pi-pu. Dessa ñlterparametrar p1-pN kodas typiskt sett separat eller tillsammans för att bli lämpliga för överföring. Filterparametrarna pl-pN och monosignalen x är tillräckliga för att möjliggöra rekonstruktion av alla kanalsignaler. De kodade ñlterparametrarna p1-pN och de kodnings- parametrar px som representerar monosignalen multíplexeras i den föreliggande utföringsformen i en multiplexerare 40 till en utsignal 52, klar för överföring.
Fig. 2b illustrerar en utföringsform av en multikanalsavkodare 24 enligt den föreliggande uppfinningen. Avkodaren 24 i fig. 2b är lämplig för avkodning av multikanalssignaler kodade med kodaren i fig. 2a. En insignal 54 tas emot och tillhandahålls till en avmultiplexerare 56, vilken delar upp insignalen 54 i kodningsparametrar px som representerar monosignalen x och ett antal uppsättningar kodade filterparametrar p1-pN. lO 15 20 25. 30 527 713 9 De kodningsparametrar px som representerar monosignalen x tillhandahålls till en monosignalsavkodare 64, i vilken de kodningsparametrar px som representerar monosignalen x används för att bilda en avkodad monosignal x" enligt någon lämplig avkodningsteknik som associeras med kodningstekniken använd i fig. 2a. Många sådana tekniker finns tillgängliga inom känd teknik. De faktiska detaljerna för kodningstekniken är inte av betydelse för att möjliggöra den föreliggande uppfinningen och diskuteras därför inte vidare. Den avkodade monosignalen x" tillhandahålls till en kanalfiltersektion 160.
De kodade ñlterparametrama tillhandahålls även till kanalñltersektionen 160, där de avkodas och används för att definiera kanalfilter 60:1-60:N. De på så sätt definierade respektive kanalñltren 60:l-60:N appliceras på den avkodade monosignalen x" varvid respektive kanalsignaler c"1-c"N återbildas och tillhandahålls på utgångar 26: l-26:N.
I de flesta utföringsformer i den föreliggande presentationen används en monosignal som en huvudsignal för att återskapa kanalsignalerna vid kodning eller avkodning. I ett allmänt angreppssätt kan emellertid vilken förutbestämd linjärkombination som helst av signaler valda bland kanalsignalerna användas som en sådan huvudsignal. Det optimala valet av förutbestämd linjärkombination beror på den faktiska tillämpningen och implementationen. En enkel kanalsignal kan också utgöra en möjlig sådan förutbestämd linjär kombination.
En annan utföringsform av en multikanalskodare 14 enligt den föreliggande uppfinningen illustreras i flg. 3a. Liknande delar betecknas med lika hänvisningssiffror och endast skillnaderna diskuteras nedan.
Linjärkombinationsenheten 34 tillhandahåller såsom tidigare en förutbestämd linjärkombination av kanalsignalerna till monosignalskodaren 38. In denna utföringsform är emellertid den signal som associeras med monosignalen x istället en avkodad version x" av de kodningsparametrar px 10 15 20 25 30 527 713 c 10 som representerar monosignalen x. Ett sådant arrangemang, hänvisat till såsom ett angreppssätt med sluten krets kommer tillåta vissa kompenseringar av onoggrannheter i kodningen av monosignalen, såsom beskrivs vidare nedan.
Den föreliggande utföringsformens linjärkombinationsenhet 34 kombinerar även kanalsignalerna i N-1 förutbestämda linjärkombinationer c*1-c*N, vilka tjänar såsom faktiska insignaler till kanalfiltersektionen 130. De N-l förutbestämda linjärkombinationerna c*1-c*N-1 bör vara sinsemellan linjärt oberoende. Linjärkombinationema c*i-c*N-i behöver inte nödvändigtvis innefatta något bidrag från alla kanalsigrialer. Termen "linjärkombination" bör i detta sammanhang användas såsom även innefattande specialfallet där en faktor för en komponent kan sättas lika med noll. Faktum är att i den enklaste uppställningen kan linjärkombinationerna c*1-c*N-1 vara identiska med kanalsignalerna c*1-c*N-1. Genom att utnyttja en avkodad monosignal x" på avkodarsidan kan de ursprungliga kanalsignalerna återställas.
De modifierade kanalsignalerna ansluts även i denna utföringsform till kanalfiltersektionen 130, i vilken N-l uppsättningar av filterkoefficienter härleds, nu motsvarande de modifierade kanalsignalerna. Koefficienterna för filteranpassningsenheterna 30:1-30:N optimeras enligt den föreliggande uppfinningen under en förnimmelsevillkorsbegränsning.
Kanalfiltersektionens 130 utgång innefattar N-l uppsättningar av filterparametrar p*1-p*N-1. Dessa filterparametrar p*1-p*N-1 kodas typiskt sett separate eller tillsammans för att bli lämpliga för överföring. De kodade filterparametrarna p* 1-p*N-1 och de kodade parametrar px som representerar monosignalen x överförs i den föreliggande utföringsformen separat.
Fig. 3b illustrerar en annan utföringsform av en multikanalsavkodare 24 enligt den föreliggande uppfinningen. Avkodaren 24 i Fig. 3b är lämplig för avkodning av multikanalssignaler kodade av kodaren i fig. 3a. Kodnings- parametrar px som representerar monosignalen x och en uppsättning kodade 10 15 20 25 30 527 713 11 filterparametrar p*i-p*N-1 tas emot. De kodningsparametrar px som representerar monosignalen x används för att bilda en avkodad monosignal x" i en monosignalsavkodare 64 i analogi med tidigare utföringsform.
Filterparametrarna p*1-p*N-1 tillhandahålls likaledes till kanalfiltersektionen 160 för att erhålla N-1 avkodade modiñerade kanalsígnaler c*i-c*N-i. En linjärkombinationsenhet 74 används sedan för att tillhandahålla rekonstruerade kanalsignaler c"1-c“N från de modifierade kanalsignalerna c*1-c*1v_i och den avkodade monosignalen x".
För att uppfatta den viktiga betydelsen av förnimmelsevillkorsbegräns- ningarna kommer ett exempel med filterkodning enligt teknikens ståndpunkt att beskrivas mer i detalj, i grunden hänvisande till det amerikanska patentet US 5,434,948. Denna multikanalskodning möjliggör låga bithastigheter om överföringen av restsignaler utelämnas. För att härleda kanalrekonstruktionsfiltret beräknar en felminimeringsprocedur baserad på ett minsta-kvadrat- eller viktat minsta-kvadrat-koncept filtren så att dess utsignal ê(n) bäst överensstämmer med målsignalen c(n).
För att beräkna filtret kan flera felmått användas. Minsta-kvadrat-felet eller det viktade minsta-kvadrat-felet är välkända och är beräkningsmässigt billiga att implementera. Enligt minsta-kvadrat-angreppssättet gäller filtret [rf en dataram, där "uc" hänvisar till "icke villkorsbegränsad", och väljs sådan att det minimerar det kvadrerade felet mellan målsignalen och filterutgången, dvs. kvadraten av skillnaden r (n)=c(n)-ê,,c(n), där n UC numrerar samplen i en dataram. Detta fel uttrycks såsom: frame end euws = Z rwoly ~ n=fmmeslnrl Detta leder till det följande linjära ekvationssystemet för ñlterkoefñcientvektorn Ef: 10 15 20 25 527 713 12 där å” är den symmetriska kovariansmatrisen för monosignalen x(n): frameend 5,, =i Zxbi-Idxvl-Jll, Lk e 1, n=frameslurl och där L” är en vektor av korskorrelationer för signaler x(n) och c(n): [m =[ fnïmiiidn -k)c(n):l, k e I. n = frame start Såsom nämndes vidare ovan kan emellertid förnimmelsekarakteristiken inte fullständigt bestämmas av en ren matematisk minimering.
En mycket viktig förnimmelsekarakteristik för multikanalssignaler är deras energi och i synnerhet de relativa nivåerna mellan multikanalsljud- signalerna. I fallet med stereokodning med förfaranden enligt teknikens ståndpunkt kan irriterande stereobildsinstabilitet där ljudkällan hoppar periodiskt från vänster till höger bli resultatet. Vidare, eftersom endast ett filter behövs i stereokodning åstadkoms ingen direkt kontroll över vänster- och högerförutsägelserna. Enligt den föreliggande uppfinningen utnyttjas en förstärkningsvillkorsbegränsning därför med fördel under optimerings- procedurer. I det sammanhanget kan det noteras att ett filter per kanal i grunden behövs, jfr. fig. 2a och fig. 2b ovan. l vissa situationer kan de förutsagda kanalerna sakna frekvensinnehåll ovanför eller under en viss frekvens. Detta inträffar om till exempel kanalen är högpassñltrerad eller är resultatet av en banduppdelningsprocedur.
Spektrala nollställen kan orsaka instabiliteter och leda till ñltersvar som ger onödig förstärkning och ljudartefakter vid låg frekvens. Enligt den 10 15 20 25 30 527 713 13 föreliggande uppfinningen utnyttjas en formvillkorsbegränsning därför med fördel under optimeringsprocedurer.
Fig. 4 illustrerar de grundläggande idéerna för den villkorsbegränsade minimeringsproceduren på kodarsidan enligt den föreliggande uppfinningen i en utföringsform som har två kanaler (stereofallet) och ett linjärñlter 31. Ett filter 31 som svarar för rekonstruktion av kanal cl som har filterkoefñcienter hu, härleds enligt en villkorsbegränsad felminimeringsprocedur i en optimeringsenhet 32. Filtret hc, tar som insignal den kombinerade kanalsignalen, dvs. monosignalen x(n), vilken i denna utföringsform är en linjär kombination av de två kanalsignalerna cl och c2: x(") = 7c1 'C1(n)+ 7:2 'c2(n) 1 och härleder utsignalen êl(n) från den. Faktorerna yd och yc, bestämmer hur kanalsignalerna kombineras. En möjlighet är att sätta 7,, till en faktor 2y och yc, till 2(l-y). I detta fall kommer monosignalen vara en viktad summa av kanalerna. I synnerhet är 7 = 0.5 en lämplig inställning, i vilket fall båda kanalerna är viktade lika. En annan lämplig inställning kan vara 76, = -yw i vilket fall monosignalen är differensen mellan kanalsignalerna.
Den viktade kombinationen av de individuella kanalsignalerna för att forma monosignalen kan allmänt sett även vara kombinationen av ñltrerade versioner av de respektive kanalsignalerna. Ett sådant angreppssätt kommer att kallas förfiltrering. Detta kan vara användbart om angreppssättet implementeras i exciteringsdomänen eller allmänt en viktad signaldomän.
Kanalerna kan till exempel förfiltreras genom ett LPC-restfilter (linjär prediktiv kodning, eng. Linear Predictive Coding) för monosignalen.
I det följande kommer mono- och vänster- och höger-kanalen allmänt antas vara någon förfiltrerad version av de verkliga mono-, vänster- och högerkanalerna. Vid återskapning av kanalerna kommer efterfiltreringssteget 10 15 20 25 30 527 713 14 med mono-LPC-syntetiseringsñltret behövas för att komma tillbaka till signaldomänerna.
I det följande diskuteras fallet yfi, = 1/2 och 7,2 =l/2 mer i detalj.
I fall där 11,, är ett FIR-filter (finit impulssvar, eng. Finite Impulse Response) är êl(n) en linjärkombination av försenade versioner av signal x(n): êl(n) = Ehn x(n - k) , Irel där indexupsättningen är I =[iminKimax]. Filterparametrarna pi innefattar ñlterkoefficienterna llc, och kanske nödvändigt tillkommande data som definierar filtret.
Om man tillämpar t.ex. kodningsförfarandet som presenteras i US 5,434,948 reproduceras differenssignalen av två kanalsignaler genom ett filter. I fig. 5 illustreras de högra och vänstra signalerna genom kurvorna 301 respektive 302. Antag att representationen inte är ideal, vilket ger en något större differens än måldifferensen över hela ramen. Detta kommer att leda till en återskapad högersignal 303 vid avkodarsidan som är något lägre än originalhögersignalen, och en återskapad vånstersignal 304 som är något högre än originalvänstersignalen. Upplevelsen av en sådan artefakt är att högerkanalens volym minskas och vänsterkanalens volym ökas. Om sådana artefakter vidare varierar i tiden kommer ljudet att pendla fram och tillbaka mellan den högra och vänstra kanalen. En förstärkningsvillkorsbegränsning kan förbättra en sådan situation.
Det ñnns flera vägar att implementera förstärkningsvillkorsbegränsningen.
Ett möjligt angreppssätt år att ha en hård villkorsbegränsning, dvs. exakt energiöverensstämmelse mellan originalkanalen och den skattade kanalen, eller att lägga på en lös förstärkningsvillkorsbegränsning sådan att utgångs- 10 15 20 25 527 713 15 kanalen har en föreskriven energi EC, , vilken inte nödvändigtvis är lika med den ursprungliga kanalsignalsenergin.
Det villkorsbegränsade minimeringsproblemet kan lätt lösas med Lagrange- förfarandet, dvs. Lagrangefunktionen: frameend frameend L(/l)= ZÅnY + ÄKEÜ - Eêflnyj n=frame stnrl n-fiame start Den optimala lösningen ger ett ñlter Qc, som är proportionellt mot det icke villkorsbegränsade ñltret Ei: = fm. Proportionalitetsfaktorn är: E01 gfl fianue end ' 2 avxny n=framesuzrl Det förstârkningsvillkorsbegränsade ñltret blir därigenom hå' = gdfifï .
Om den föreliggande kodningsprincipen används i ett begränsat frekvensband kan en kanalsignal se ut som kurva 305 i Fig. 6. Ingen intensitet finns under frekvens fi eller över frekvens fz. En ren matematisk optimering ger emellertid upphov till en kurva 306, vilken visar upp viss begränsad effekt även under och över frekvenserna fl respektive fg. Sådana artefakter är förnimbara.
För att lägga på en viss spektralform på filtret måste en uppsättning linjära villkorsbegränsningar läggas på filtret. Dessa villkorsbegränsningar skulle allmänt sett vara av ett antal mindre än antalet koefficienter för filtret.
Till exempel, om man vill sätta en villkorsbegränsning för ett spektralt nollställe vid 0 kHz är en lämplig villkorsbegränsning: 10 15 20 25 30 527 713 16 Zht.(k)= fr =0- kel Allmänt sett kan formvillkorsbegränsningen formuleras genom en matris och en vektor sådana att :wc ' Från teorin om villkorsbegränsade minsta-kvadrater är det optimala filter som uppfyller dessa begränsningar: ai” =aï ßllífhïëllcllwf -ifhfl Denna villkorsbegränsning är speciellt användbar när det är känt a priori att kanalen inte har något frekvensinnehåll i ett visst frekvensområde.
Förstärknings- och formvillkorsbegränsningarna kan också kombineras. I ett sådant fall tillämpas företrädesvis formvillkorsbegränsningen först och förstärkningsvillkorsbegränsningen adderas sedan som en faktor enligt: E frame end Z ¿.w(n)z ' n=framesmr| här: = gchsn ge _: L. _.c7 Eftersom ñltren beror på det obegränsade filtret och det senare följer, eftersom cl(n)+ c2(n) = 2x(n) , relationen: hïïflfï =2<>U (1) där ö' betecknar identitetsfiltret. Användbara egenskaper kan härledas för de formvillkorsbegränsade filtren, om víllkorsbegränsningarna på de två kanalerna år identiska, 10 15 20 25 30 527 713 17 då hä? +11: = 26 Ja: m'¿=.;l1l'(.w-2lï.”lß)- Denna ekvation är användbar för bithastighetsreducering vid kodning av kanalfiltren, eftersom det visar sig att kanalfiltren är relaterade genom kvantiteter som finns tillgängliga på avkodarsidan.
Relationen mellan de formvillkorsbegränsade filtrena öppnar även upp för en rationell beräkning av flltrena. I fig. 7 visar en illustration att en cl av två kanaler cl, c2 reproduceras genom att applicera monosignalen x på ett icke villkorsbegränsat ñlter 131. Resultatet från det icke villkorsbegränsade filtret modifieras beroende på forrnvillkorsbegränsningar i en formvillkors- begränsningssektion 132. Från det formvillkorsbegränsade filtret för cl- kanalen kan även det formvillkorsbegränsade filtret för kanal c2 beräknas och tillhandahållas till separata förstärkningsvillkorsbegränsningssektioner 133 för varje kanal.
Ett mer detaljerat blockdiagram för en annan utföringsforrn som använder en sidosignal för att applicera formvillkorsbegränsningen illustreras i fig. 8.
Två kanalsignaler c1 och cq kombineras i additionsorgan 55, 57 i en linjärkombinationsenhet 34 till en monosignal x och en sidosignal s. En kanalñltersektion 130 innefattar ett icke villkorsbegränsat parametriskt ñlter 131, vilket applicerat på monosignalen x reproducerar en skattning av sidosignalen š. I en icke villkorsbegränsad optimeringsenhet 33, anpassas ñlterkoefñcienterna för att ge den minsta skillnaden mellan s och š. Det ñlter som uppnås på detta sätt 13:” tillhandahålls till en forrnvillkors- begränsningssektion 132, i grunden enligt diskussionerna längre upp. Ett formvillkorsbegränsat ñlter 11:” för sidosignalen skapas. Från relationen (1) 10 15 20 25 30 527 713 18 mellan kanalñlter i en stereotillämpning beräknas ett formvillkorsbegränsat filter för varje kanalsignal, baserat på det formvillkorsbegränsade filtret Qi' för sidosignalen. Dessa filter, eller snarare deras koefficienter, tillhandahålls till en respektive förstärkningsvillkorsbegränsningssektion 13321, 133:2. En förstärkningsfaktor för varje kanalsignal beräknas och de två filtren tillhandahålls till en parameterkodningssektion 66, där de två ñltrens parametrar kodas tillsammans.
Efter beräkning av de villkorsbegränsade kanalñltren hd och IL, kvantiseras och kodas de till en representation, vilken är lärnplig för överföring till mottagaren. Typiskt sett kvantiseras ñltrens koefficienter genom användning av skalära eller vektorkvantiserare och kvantiserarindex överförs.
Kvantiserarna kan även implementera prediktion, vilket är mycket fördelaktigt för bithastighetsreduktion speciellt i detta scenarium.
Genom att använda filtrens komplementegenskaper för kan man ytterligare reducera bithastigheten eftersom endast ett av filtren hd eller 13,2 eller en linjär-kombination av dem kvantiseras och överförs medan förstärkningarna gu och gc, vektorkvantiseras tillsammans och överförs separat. En sådan överföring kan utföras vid bithastigheter så låga som t.ex. 1 kbps.
Mottagaren avkodar först den överförda monosignalen och de överförda kanalfiltrena. Sedan regenererar den de olika kanalsignalerna genom filtrering av monosignalen genom de respektive kanalfiltren. Företrädesvis används i stereofallet fullständighetsegenskapen och koefficienterna återkombineras för att producera filtren llc, och äcz.
Vissa efterbearbetningssteg som ytterligare förbättrar den rekonstruerade multikanalssignalens kvalitet kan följa regenereringen av de olika kanalsignalerna. 10 15 20 25 30 527 713 19 Det är ibland till fördel att jämna ut förstärkningen för de formvillkors- begränsade filtren eller en linjärkombination av dessa filter innan beräkning av de förstärkningsvillkorsbegränsade kanalñltrena.
Till exempel, i fallet med stereo, är det ekvivalenta sidosignalsñltret (såsom används i fig. 8): ä? = O-Shf -0-51112 och för att minska möjliga artefakter jåmnas förstärkningsskillnaden för detta filter ut mellan på varandra följande ramar, vilket leder till ett filter [íf .
Kanalfiltren modifieras enligt: EÉ=ö+šf ~sc ~sc älrl = 6 _ ä: ' Denna typ av modifiering bevarar inte formvillkorsbegränsningarna men man kan emellertid lätt se att formvillkorsbegränsningar fortfarande bevaras på sidosignalsfiltret och detta är tillräckligt i fallet med stereokodning.
Förstärkningsvillkorsbegränsningen på filtrena antar tidigare beräknade kanalenergier, dvs. ECPEÛ. Det är viktigt att styra ñltrens förstärkning, tex. gwgd och att undvika onödig förstärkning genom begränsning av förstårkningarna. Beroende på de olika kanalsignalernas egenskaper kan det inträffa att kanalerna är antikorrelerade över hela frekvensområdet eller i vissa frekvensband. Detta leder till en viss utsläckning när monokanalen bildas. I detta fall, eftersom den individuella kanalinformationen har förlorats, åtminstone delvis och i vissa frekvensband, är det ofta till fördel att begränsa kanalförstärkningarna när dessa är större än en viss storlek, tex.
O dB. Ett sätt att utföra denna förstärkningsbegränsning är att beräkna en viss förstärkningsfaktor: lO 15 20 25 30 5 2 7 7 1 3 lb 425092 = äcflny + Écflny n=0 gr vilken är kvoten mellan den effektiva monokanalsenergin och energin för monokanalen om de två kanalerna vore okorrelerade. När denna faktor är mindre än 0 dB har vi signalutsläckning. I detta fall kvantiserar g, hur allvarlig denna utsläckning Förstärkningsbegränsningen kan sedan beräknas som: gt] (dB) = max(gcl(dß)+ gpgzßlo), när g, < o dB .
Samma begränsning gäller för förstärkningen för de andra kanalerna.
Det är inte bara kanalfilterparainetrarna som behöver kodas och överföras, utan även monosignalen. Det finns två olika principangreppssätt för att beakta monosignalsljudkodning när kanalfilterkoefficienter härleds.
På ett sätt med öppen krets härleds filtren baserade på originalmonosignalen. Detta är t.ex. fallet i fig. 2a, där signalen 42 är originalrnonosignalen x. Avkodaren kommer emellertid att använda en kvantiserad monosignal som insignal för kanalfiltreringen.
På ett sätt med sluten krets baseras filterberäkningarna på den kodade och alltså redan kvantiserade monosignalen. Detta är t.ex. fallet i ñg. 3a, där signalen 44 är en avkodad monosignal x". Detta angreppssätt har fördelen att kanalfilterutformningen inte endast syftar till att passa ihop de respektive kanalsignalerna på bästa möjliga sätt. Den syftar även till att mildra kodningsfel, vilka är resultatet av monosignalskodningen.
Principerna som hittills har beskrivits kan tillämpas på hela spektrumet, dvs. fullbandssignaler. De är emellertid lika bra eller till och med mer fördelaktigt tillämpbara på delband av signalerna. Fig. 9 illustrerar 10 15 20 25 30 527 713 21 principerna för delbandsbearbetning. Ett antal kanaler c; - cN delas var och en in i K delband SBl, SB2, SBK. Kanalsignalerna i varje delband tillhandahålls till en respektive multikanalskodarenhet 80:l-80:K, där kanalsignalerna kodas. En eller flera av multikanalskodarenheterna 80:1- 80:K kan vara multikanalskodarenheter enligt den föreliggande uppfinningen. En bitströmskombinerare 82 kombinerar de kodade signalerna till en gemensam kodad signal 53, som överförs.
Fördelar med den beskrivna delbandsbearbetningen är att multikanals- kodning för de olika delbanden kan utföras individuellt, optimerat med avseende på t.ex. tilldelad bithastighet, bearbetningsramsstorlek och samplingstakt.
En speciell sort av delbandsbearbetning utför inte multikanalskodning för mycket låga frekvenser, t.ex. under 200 Hz. Detta betyder att för detta mycket låga frekvensband överförs en ren monosignal. Denna princip använder det faktum att den mänskliga stereouppfattningen är mindre känslig för mycket låga frekvenser. Det är känt från teknikens ståndpunkt och kallas subwooñng.
I en ytterligare utföringsform av delbandsbearbetningen görs bandsplíttringen under användning av en tid-frekvens-transform såsom t.ex. en korttids-Fourier-transform (STFT), vilken tillåter uppdelning av signalen i enstaka frekvenskomponenter. I detta fall reduceras filtreringen till en ren multiplikation av monosignalens individuella spektrala koefñcienter med en komplex faktor.
Det parametriska multikanalskodningsförfarandet enligt uppfinningen kommer typiskt sett att inbegripa fast ramvis bearbetning av signalsampel.
Med andra ord hårleds parametrar som beskriver multikanalsbilden och överförs med en hastighet som motsvarar en kodningsramlängd av t.ex. 20 ms. Parametrarna kan emellertid erhållas från sígnalramar vilka är mycket större än kodningsramlängden. Ett lämpligt val är att sätta längden av 10 15 20 25 30 527 713 22 sådana analysramar till värden som är större än kodningsramens längd.
Detta medför att parameterberåkningen utförs med överlappande analysramar.
Detta illustreras i ñg. 10. Analysramar 83 vid kodaren är något längre än kodningsramar 84, såsom visas i övre delen av figuren. En konsekvens av sådana överlappande analysramar är att parametrarna utvecklas jämnt, vilket är väsentligt för att tillhandahålla ett stabilt intryck av multikanalsljudsignalerna. Samma sak utförs på avkodarsidan, vilket visas i mitten av figuren. Det är alltså väsentligt i avkodaren att ta hänsyn till detta och att bilda fönster och att lägga till överlapps till syntetiseringsramar 85, med ett överlapp 86, såsom visas i nedre delen av figuren. Detta möjliggör en jämn övergång mellan filter som associeras med varje ram. Även vid kodaren kan jämn filterparameterutveckling tvingas fram. Det är t.ex. möjligt att tillämpa lågpass- eller medianfiltrering på filterparametrarna.
Såväl monofona ljudkodekar som talkodekar enligt teknikens ståndpunkt utför så kallad brusformning av kodningsbruset. Syftet med denna operation är att flytta kodningsbruset till frekvenser där signalen har hög spektral densitet och alltså gör bruset mindre hörbart. Brusfonnning görs vanligtvis adaptivt, dvs. som svar på ljudsignalen. Detta medför att i allmänhet kommer brusformning utförd på monosignalen att vara olik den som fordras för de olika kanalsignalerna. Som ett resultat, trots passande brusformning i monoljudkodeken kan den efterföljande kanalfiltreringen enligt den föreliggande uppfinningen leda till en hörbar kodningsbrusökning i den rekonstruerade multikanalssignalen når den jämförs med det hörbara kodningsbruset i monosignalen.
För att mildra detta problem kan signaladaptiv efterfiltrering tillämpas på de rekonstruerade kanalsignalerna i ett efterbearbetningssteg i mottagaren.
Vilken efterfiltreringsteknik som helst enligt teknikens ståndpunkt kan 10 15 20 25 30 527 713 23 utnyttjas här, vilket väsentligen betonar spektrala toppar eller fördjupar spektrala dalar och därigenom reducerar det hörbara bruset. Ett exempel på en sådan teknik är så kallad högupplöst efterfiltrering, vilken beskrivs i det Europeiska patentet O 965 123 Bl av E. Ekudden et. al. Andra enkla förfaranden är så kallade "pitch- och formanfl-efterfilter, vilka är kända från talkodning.
I ñg. ll illustreras huvudstegen i en utföringsform av ett kodningsförfarande enligt den föreliggande uppñnningen som ett flödesdiagram. Proceduren börjar i steg 200. I steg 220 kodas en huvudsignal, företrädesvis en monosignal, som är härledd från multikanalssignalerna. I steg 222 optimeras ñlterkoefficienter för att ge en så bra representation som möjligt av en kanalsignal när de appliceras på huvudsignalen. Optimeringen äger rum under fömimmelsevillkorsbegränsningar. De optimala koefficienterna kodas sedan i steg 224. Proceduren slutar i steg 299.
Utföringsformerna beskrivna ovan ska förstås såsom några illustrativa exempel på den föreliggande uppfinningen. Det inses av fackmannen att olika modifieringar, kombinationer och ändringar kan göras på utföringsformerna utan att avlägsna sig från den föreliggande uppñnningens omfattning. I synnerhet kan olika dellösningar i de olika utföringsforrnerna kombineras till andra konfigurationer, där så är tekniskt möjligt. Den föreliggande uppñnningens omfattning definieras emellertid av de bifogade kraven.
REFERENSER Amerikanskt patent US 5,285,498 Amerikanskt patent US 5,434,948 Europeiskt patent EP O 497 413 Europeiskt patent EP 0 965 123 527 715 24 "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, maj 2002, München, Tyskland av C.
Faller et al.

Claims (18)

l0 15 20 25 30 527 715 Q S' NYA PATENTKRAV 2004-01-01 PATENTKRAV
1. Ett förfarande för kodning av multikanalssignaler (oi-CN) innefattande åtminstone en första och en andra kanal, innefattande stegen: generering av kodningsparametrar (px) som representerar en huvudsignal (x) som är en första förutbestämd linjärkombination av signaler från multikanalssignalerna (c1-cN); härledning av optimala parametrar (pi-pn) för ett första anpassningsbart filter (31; 131, 132, 133:1-2); och kodning av de optimala parametrarna [pi-pu), kännetecknat av det ytterligare steget: härledning av optimala parametrar (pi-pm) för åtminstone ett andra anpassningsbart filter (31, 131, 132, 133:1-2); vilket första anpassningsbara filter (3l; 131, 132, l33:1-2) hårleds för att ge en minimal skillnad mellan signalen för den första kanalen (ei-CN) och en filterutsignal när det första anpassningsbara ñltret (31; 131, 132, 13311-2) appliceras på den första förutbestämda línjärkombinatíonen (x); vilken minimal skillnad är definierad enligt ett första kriterium; vilket andra anpassningsbara filter (31; 131, 132, 133:1-2) härleds för att ge en minimal skillnad mellan signalen för den andra kanalen (Ci-CN) och en filterutsignal när det andra anpassningsbara filtret (31; 131, 132, 133: 1-2) appliceras på den första förutbestämda linjärkombinationen (x); vilken minimal skillnad är definierad enligt ett andra kriterium; varvid härledningsstegen för de första och andra anpassningsbara filtren (31, 131, 132, 133:1-2) utförs under åtminstone en förnimmelsevillkorsbegränsning vald från gruppen av förstärkningsvillkorsbegränsning och formvillkorsbegränsning.
2. Ett förfarande enligt krav 1, kännetecknat av att åtminstone ett av det första kriteriet och det andra kriteriet är ett minsta-kvadrat-kriterlum.
3. Ett förfarande enligt krav 1 eller 2, kännetecknat av att förnimmelsevillkorsbegränsningen år åtminstone en förstärkningsvillkors- 10 15 20 25 527 713 2 6 NYA PATENTKRAV 2004 -0 1 -O l begränsning, vilken strävar efter att ge en total energi för filterutsignalen som är lika med en total energi för den första kanalens signal.
4. Ett enligt krav 3, kännetecknat av att förstärkningsvillkorsbegränsningen är en absolut villkorsbegränsning, vilken förfarande kräver att den totala energin för filterutsignalen år lika med den totala energin för den motsvarande kanalens signal.
5. Ett förfarande kännetecknat av att förstärkningsvillkorsbegränsningen år en mjuk villkorsbegränsning, vilken enligt krav 3, gynnar filter som ger den totala energin för ñlterutsignalen nära den totala energin för den motsvarande kanalens signal
6. Ett förfarande enligt krav 3, kännetecknat av att förstärkningsvillkorsbegränsningen införs som en förstärkningsfaktor (ge, - gm) gånger ett anpassningsbart filter som härletts utan fórstärkningsvillkorsbegränsningar.
7. Ett förfarande enligt krav 6, kännetecknat av att förstärkningsvillkorsbegänsningsfiltret hf ges av: f = gchf, E c m framzend ' 2 êw (ny n=framestart ge: där 11:” är det anpassningsbara filtret som härletts utan förstärkningsvillkors- begränsningar, EC en föreskriven energi för filterutsignalen och ê“°(n) är en filterutsignal för huvudsignal x(n) utan förstärkningsvillkorsbegränsningar. 10 15 20 25 30 527 713 2 P NYA PArENrxaAv 2004-01-01
8. Ett förfarande enligt något av kraven 1 till 7, kännetecknat av att förnimmelsevillkorsbegränsningen år åtminstone en formvillkorsbegränsning, vilken inför en fördefinierad spektralform på det anpassningsbara filtret (3l; 131, 132, 1334-2).
9. Ett förfarande enligt krav 8, kännetecknat av att formvillkors- begränsningen inför nollinnehåll i ett fördefinierat frekvensintervall.
10. Ett förfarande enligt något av kraven l till 9, kännetecknat av att kodningssteget för de optimala parametrarna (pi-pn) innefattar samtidig kodning av de optimala parametrarna för de första och andra anpassningsbara filtren.
11. Ett förfarande enligt något av kravenl till 10 och enligt krav 8, kännetecknat av att härledningssteget för parametrarna i sin tur innefattar stegen: skapande av en andra förutbestämd linjärkombinatíon (s; c*1-c*N-1) av signalerna från multikanalssignalerna (c1-cN); härledning av parametrar för ett tredje ñlter för att ge en minimal skillnad mellan den andra förutbestämda linjårkombinationen och filterutsignalen när det tredje filtret appliceras på den första förutbestämda linjärkombinationen, under formvillkorsbegränsningen; beräkning av de optimala parametrarna för de första och andra filtren som en funktion av de optimala parametrarna för det tredje filtret.
12. Ett förfarande enligt något av kraven 1 till ll, kännetecknat av att hårledningssteget utförs baserat på de kodningsparametrar (px) som representerar huvudsignalen (x).
13. Ett förfarande enligt något av kraven 1 till 11, kännetecknat av att härledningssteget utförs baserat direkt på den första förutbestämda linjärkombinationen (x). 10 15 20 25 30 527 713 J! NYA PATENTKRAV 2004-0 1 -0 1
14. Ett förfarande enligt något av kraven 1 till 13, kännetecknat av att multikanalssignalerna innefattar fler än två kanaler, varvid huvudsignalen baserar sig på en första förutbestämd linjärkombination (x) av alla de fler än två kanalerna, och signalen för varje kanal representeras av ett separat anpassningsbart filter, vilket är optimerat under förnimmelsevillkors- begränsningen.
15. Ett förfarande för avkodning av polyfoniska signaler som innefattar kodningsparametrar (px) som representerar en huvudsignal och kodade optimala parametrar för ett första anpassningsbart filter (öOzl-öOzN), innefattande stegen: avkodning av de kodningsparametrar (px) som representerar huvudsignalen; generering av en signal för en första kanal (c"1-c"N) genom applicering av det första anpassningsbara filtret (60:1-60:N) på den avkodade huvudsignalen (x"), kännetecknat av att kodningsparametrarna (px) vidare representerar kodade optimala parametrar för ett andra anpassningsbart filter (60: l-60:N); varvid förfarandet vidare innefattar steget generering av en signal för en andra kanal (c"1-c"N) genom applicering av det andra filtret (60:1-60:N) på den avkodade huvudsignalen (x"); vilka första och andra anpassningsbara ñlter (30: 1-30:N) är optímerade under åtminstone en förnirnmelsevillkorsbegränsning vald från gruppen av förstârkningsvillkorsbegränsning och formvillkorsbegränsning.
16. Ett förfarande enligt krav 15, kännetecknat av steget: generering av en signal för en andra kanal (c"1-c“N) som en förutbestämd linjärkombination av den avkodade huvudsignalen (x") och signalen för den första kanalen (c"1-c“N).
17. Kodníngsapparat (14), innefattande: lO 15 20 25 30 527 715 19 NYA PATENTKRAV 2004-0 l -0 l ingång (16:1-16:N) för multikanalssignaler (Ci-CN) som innefattar åtminstone en första och en andra kanal; organ (38) för generering av kodningsparametrar (px) som representerar en huvudsignal (x), vilken är en första förutbestämd linjärkombination av signaler från multikanalssignalerna (crcN), vilket organ (38) för generering är anslutet till ingången (16: l- l6:N); organ (3l; 131, 132, l33:1-2) för härledning av optimala parametrar för ett första anpassningsbart filter; organ (66) för kodning av de optimala parametrarna; och utgångsorgan (52); kännetecknar! av: organ (3l; 131, 132, l33:1-2) för härledning av optimala parametrar för ett andra anpassningsbart filter; vilket första anpassningsbart filter ger minimal skillnad mellan signalen för den första kanalen (c1-cN) och filterutsignalen när det första anpassningsbara filtret appliceras på den första förutbestämda linjärkombinationen (x); vilken minimal skillnad är definierad enligt ett första kriterium; vilket andra anpassningsbart filter ger minimal skillnad mellan signalen för den andra kanalen (cl-CN) och filterutsignalen när det andra anpassningsbara filtret appliceras på den första förutbestämda linjärkombinationen (x); vilken minimal skillnad är definierad enligt ett andra kriterium; varvid organet (3l; 131, 132, 13321-2) för härledning av de optimala parametrarna för de första och andra anpassningsbara filtren är anordnat för härledning av de optimala parametrarna under åtminstone en förnimmelsevillkorsbegränsning vald från gruppen av förstärkningsvillkors- begränsning och formvillkorsbegränsning.
18. Avkodningsapparat (24), innefattande: ingångsorgan (54) för kodningsparametrar (px) som representerar en huvudsignal (x) och kodade optimala parametrar för ett första anpassningsbart filter; 10 527 715 so NYA PATENTKRAV 2004 -0 l -0 1 organ (64) för avkodning av de kodningsparametrar (px) som representerar en huvudsignal (x); organ (60:1-60:N) för generering av signaler för en första kanal genom applicering av det första anpassningsbara filtret på den avkodade huvudsignalen (x"), kännetecknar! av att kodningsparametrania (px) vidare representerar kodade optimala parametrar för ett andra anpassningsbart filter; varvid avkodarapparaten vidare innefattar organ (60:1-60:N) för generering av signaler för en andra kanal genom applicering av det andra anpassningsbara filtret på den avkodade huvudsignalen (x"); vilka första och andra filter är optimerade under åtminstone en förnimmelsevillkorsbegränsning vald från gruppen av förstärkningsvillkors- begränsning och forrnvillkorsbegränsning.
SE0400415A 2003-12-19 2004-02-20 Kodning av polyfoniska signaler med villkorsbegränsade filter SE527713C2 (sv)

Priority Applications (10)

Application Number Priority Date Filing Date Title
SE0400415A SE527713C2 (sv) 2003-12-19 2004-02-20 Kodning av polyfoniska signaler med villkorsbegränsade filter
US11/011,764 US7725324B2 (en) 2003-12-19 2004-12-15 Constrained filter encoding of polyphonic signals
DK04809080.7T DK1639580T3 (da) 2003-12-19 2004-12-15 Kodning af flerkanalssignaler
JP2006518597A JP4323520B2 (ja) 2003-12-19 2004-12-15 ポリフォニック信号の制約付きフィルタ符号化
ES04809080.7T ES2439693T3 (es) 2003-12-19 2004-12-15 Codificación de señales de múltiples canales
PL04809080T PL1639580T3 (pl) 2003-12-19 2004-12-15 Kodowanie sygnałów wielokanałowych
EP04809080.7A EP1639580B1 (en) 2003-12-19 2004-12-15 Coding of multi-channel signals
PCT/SE2004/001907 WO2005059901A1 (en) 2003-12-19 2004-12-15 Constrained filter encoding of polyphonic signals
EP12154099A EP2456236A1 (en) 2003-12-19 2004-12-15 Constrained filter encoding of polyphonic signals
PT48090807T PT1639580E (pt) 2003-12-19 2004-12-15 Codificação de sinais de multicanais

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0303499A SE0303499D0 (sv) 2003-12-19 2003-12-19 Multi-channel coding using gain-shape constrained filters
SE0400415A SE527713C2 (sv) 2003-12-19 2004-02-20 Kodning av polyfoniska signaler med villkorsbegränsade filter

Publications (3)

Publication Number Publication Date
SE0400415D0 SE0400415D0 (sv) 2004-02-20
SE0400415L SE0400415L (sv) 2005-06-20
SE527713C2 true SE527713C2 (sv) 2006-05-23

Family

ID=31996352

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0400415A SE527713C2 (sv) 2003-12-19 2004-02-20 Kodning av polyfoniska signaler med villkorsbegränsade filter

Country Status (8)

Country Link
EP (2) EP2456236A1 (sv)
JP (1) JP4323520B2 (sv)
DK (1) DK1639580T3 (sv)
ES (1) ES2439693T3 (sv)
PL (1) PL1639580T3 (sv)
PT (1) PT1639580E (sv)
SE (1) SE527713C2 (sv)
WO (1) WO2005059901A1 (sv)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100010811A1 (en) * 2006-08-04 2010-01-14 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
CN102177542B (zh) * 2008-10-10 2013-01-09 艾利森电话股份有限公司 能量保留多通道音频编码

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
SE9700772D0 (sv) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
WO2003009206A1 (en) * 2001-07-19 2003-01-30 Sungwoo Kim The system and operational method of mobile telecommunication device for electronic cash
WO2003009208A1 (en) * 2001-07-20 2003-01-30 Medical Research Group Method and apparatus for communicating between an ambulatory medical device and a control device via telemetry using randomized data
BRPI0304541B1 (pt) 2002-04-22 2017-07-04 Koninklijke Philips N. V. Method and arrangement for synthesizing a first and a second output sign from an input sign, and, device for providing a decoded audio signal

Also Published As

Publication number Publication date
DK1639580T3 (da) 2014-01-13
JP4323520B2 (ja) 2009-09-02
EP1639580B1 (en) 2013-10-23
EP1639580A1 (en) 2006-03-29
PL1639580T3 (pl) 2014-04-30
PT1639580E (pt) 2013-11-19
SE0400415D0 (sv) 2004-02-20
WO2005059901A1 (en) 2005-06-30
EP2456236A1 (en) 2012-05-23
SE0400415L (sv) 2005-06-20
JP2007527543A (ja) 2007-09-27
ES2439693T3 (es) 2014-01-24

Similar Documents

Publication Publication Date Title
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
CN104851427B (zh) 解码系统和解码方法
CN107430863B (zh) 用于编码的音频编码器及用于解码的音频解码器
EP2981956B1 (en) Audio processing system
KR101183857B1 (ko) 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치
TWI466106B (zh) 音訊或視訊編碼器、音訊或視訊解碼器及用以利用可變預測方向來處理多頻道音訊或視訊信號的相關方法
US9666198B2 (en) Reconstruction of audio scenes from a downmix
KR101178060B1 (ko) 공간 오디오 코딩에서의 복수채널 역상관
TWI544479B (zh) 音訊解碼器、音訊編碼器、用以基於已編碼表示型態提供至少四音訊聲道信號的方法、用以基於至少四音訊聲道信號提供已編碼表示型態的方法、及使用頻寬擴展的電腦程式
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
US20090112606A1 (en) Channel extension coding for multi-channel source
EP1851759A1 (en) Improved filter smoothing in multi-channel audio encoding and/or decoding
KR20120006010A (ko) 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩
CN110223701B (zh) 用于从缩混信号产生音频输出信号的解码器和方法
US7725324B2 (en) Constrained filter encoding of polyphonic signals
JP2019506633A (ja) 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法
CN117854515A (zh) 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置
SE527713C2 (sv) Kodning av polyfoniska signaler med villkorsbegränsade filter
CN110998721B (zh) 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置
AU2018200340A1 (en) Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding