SE519552C2 - Flerkanalig signalkodning och -avkodning - Google Patents

Flerkanalig signalkodning och -avkodning

Info

Publication number
SE519552C2
SE519552C2 SE9803321A SE9803321A SE519552C2 SE 519552 C2 SE519552 C2 SE 519552C2 SE 9803321 A SE9803321 A SE 9803321A SE 9803321 A SE9803321 A SE 9803321A SE 519552 C2 SE519552 C2 SE 519552C2
Authority
SE
Sweden
Prior art keywords
matrix
channel
denotes
synthesis
block
Prior art date
Application number
SE9803321A
Other languages
English (en)
Other versions
SE9803321D0 (sv
SE9803321L (sv
Inventor
Tor Bjoern Minde
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE9803321A priority Critical patent/SE519552C2/sv
Publication of SE9803321D0 publication Critical patent/SE9803321D0/sv
Priority to PCT/SE1999/001610 priority patent/WO2000019413A1/en
Priority to KR10-2001-7004041A priority patent/KR100415356B1/ko
Priority to EP99969816A priority patent/EP1116223B1/en
Priority to CN998115908A priority patent/CN1132154C/zh
Priority to DE69940068T priority patent/DE69940068D1/de
Priority to CA002344523A priority patent/CA2344523C/en
Priority to JP2000572833A priority patent/JP4743963B2/ja
Priority to AU11921/00A priority patent/AU756829B2/en
Priority to US09/407,599 priority patent/US6393392B1/en
Publication of SE9803321L publication Critical patent/SE9803321L/sv
Publication of SE519552C2 publication Critical patent/SE519552C2/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

lO 15 20 25 30 519 552 f) 4. formskodande metoder [9]. Problemet med stereokanaler påträffas även vid ekosiäckning, en översikt ges i moi. “ Ur denna beskrivna teknikens ståndpunkt är det känt att en gemensam kodningstek- nik kan utnyttja inter-kanalredundansen. Detta särdrag har använts för audiokodning (musik) vid högre bithastigheter och vid vågformskodning, såsom vid subbandskod- ning i) MPEG. Ytterligare reducering av bithastigheten, under M (antalet kanaler) gånger 16-20 kb/s, och att genomföra detta för bredbandiga (approximativt 7 kHz) eller smalbandiga (3-4 kHz) signaler erfordrar en effektivare kodningsteknik.
SUMMERING AV UPPFINNINGEN Ett syftemål för föreliggande uppfinning är reducering av kodningsbittakten vid flerkanalig signalkodning genom analys-genom-syntes från M (antalet kanaler) gånger kodningsbittakten för en enda (mono) kanal till en lägre bittakt.
Detta syftemål löses i enlighet med de bifogade patentkraven.
Kort uttryckt innebär föreliggande uppfinning generalisering av olika element i en enkanalskodare av linjär prediktiv analys-genom-syntes-typ (LPAS) till motsvarande flerkanalselement. De mest fundamentala modifieringarna erfordras i analys- och syntesfiltren, vilka ersätts med filterblock med matrisvärda överföringsfunktioner.
Dessa matrisvärda överföringsfunktioner kommer att ha icke diagonala matrisele- ment som reducerar inter-kanalredundansen. En annan fundamental egenskap är att sökningen efter bästa kodningsparametrar utförs i en sluten slinga (analys-genom- syntes).
KORT BESKRIVNING AV RlTNlNGARNA Föreliggande uppfinning samt ytterligare syftemål och fördelar som uppnås med denna förstås bäst genom hänvisning till nedanstående beskrivning samt de bifogade ritningarna, i vilka FIG. 1 är ett blockschema av en konventionell enkanalig LPAS-talkodare; 10 15 20 25 30 519 552 3 FIG. 2 är ett blockschema av en_ utföringsfonn av analysdelen av en flerkanalig LPAS-talkodare i enlighet med föreliggande uppfinning; FIG. 3 är ett blockschema av en exemplifierande utföringsform av syntesdelen av en flerkanalig LPAS-talkodare i enlighet med föreliggande uppfinning; FIG. 4 år ett blockschema som illustrerar en modifiering av en enkanalig signalad- derare för bildande av ett flerkanaligt signaladderarblock; i FIG. 5 är ett blockschema som illustrerar modifiering av ett enkanaligt LPC- analysfilter för bildande av ett flerkanaligt LPC-analys filterblock; FIG. 6 är ett blockschema som illustrerar modifiering av enkanaligt viktningsfilter för bildande av ett flerkanaligt viktningsfilterblock; FIG. 7 är ett blockschema som illustrerar modifiering av en enkanalig energiberäk- nare för bildande av ett flerkanaligt energiberäkningsblock; FIG. 8 är ett blockschema som illustrerar modifiering av ett enkanaligt LPC- synthesfilter för bildande av ett flerkanaligt LPC-syntesfilterblock; FIG. 9 är ett blockschema som illustrerar modifiering av en enkanalig fast kodbok för bildande av ett flerkanaligt fast kodboksblock; FIG. 10 är ett blockschema som illustrerar modifiering av ett enkanaligt fördröj- ningselement för bildande av ett flerkanaligt fördröjningselementblock; FIG. 11 är ett blockschema som illustrerar modifiering av ett enkanaligt långtids- prediktorksyntesblock för bildande av ett flerkanaligt Iångtidsprediktorsyntesblock; FIG. 12 är ett blockschema som illustrerar en annan utföringsforrn av ett flerkana- ligt LPC-analysfilterblock; FIG. 13 är ett blockschema som illustrerar en utföringsforrn av ett flerkanaligt LPC- syntesfllterblock som svarar mot analysfilterblocket i flgur 12; FIG. 14 är ett blockschema av en annan konventionell enkanalig LPAS-talkodare; FIG. 15 är ett blockschema av en exemplifierande utföringsform av analysdelen av en flerkanalig LPAS-talkodare i enlighet med föreliggande uppfinning; FIG. 16 är ett blockschema av en exemplifierande utföringsform av syntesdelen av en flerkanalig LPAS-talkodare i enlighet med föreliggande uppfinning; FIG. 17 är ett blockschema som illustrerar modifiering av det enkanaliga Iångtids- prediktoranalysfiltret i flgur 14 för bildande av det flerkanaliga Iångtidsprediktor- analysfilterblocket i flgur 15; lO 15 20 25 30 519 552 LI FIG. 18 är ett flödesschema som illustrerar en exemplifierande utföringsform av en sökmetod i enlighet med föreliggande uppfinning; och FIG. 19 är ett flödesschema som illustrerar en annan exemplifierande utförings- form av en sökmetod i enlighet med föreliggande uppfinning.
DETALJERAD BESKRIVNING AV DE FÖREDRAGNÅ UTFÖRINGSFORMERNA Föreliggande uppfinning kommer nu att beskrivas genom introduktion av en konven- tionell enkanalig linjär prediktiv talkodare av analys-genom-syntes-typ (LPAS), och genom beskrivning av modifieringar i varje block av denna kodare som kommer att transformera den till en flerkanalig LPAS-talkodare.
Fig. 1 är ett blockschema av en konventionell enkanalig LPAS-talkodare, se [11] för en mera detaljerad beskrivning. Talkodaren består av två delar, nämligen en syntesdel och en analysdel (en motsvarande avkodare kommer att innehålla en syntesdel).
Syntesdelen består ett LPC-syntesfilter 12, som mottager en excitationssignal i(n) och utmatar en syntetisk falsignal s(n). Excitationssignalen i(n) bildas genom addering av två signaler u(n) och v(n) i en adderare 22. Signalen u(n) bildas genom skalning av en signal f(n) från en fast kodbok 16 med en förstärkning gp i ett förstärkningselement 20.
Signalen v(n) bildas genom skalning av en fördröjd (med fördröjningen "lag") version av excitationssignalen i(n) från en adaptiv kodbok 14 med en förstärkning gp. i ett förstärkningselement 18. Den adaptiva kodboken bildas genom en återkopplingsslinga innehållande ett fördröjningselement 24, som fördröjer excitationssignalen i(n) med en subramlängd N. Den adaptiva kodboken kommer därför att innehålla tidigare excitatio- ner i(n) som skiftats in i kodboken (de äldsta excitationerna skiftas ut ur kodboken och ignoreras). LPC-syntesfiltrets parametrar uppdateras i typfallet varje ram om 20-40 ms, medan den adaptiva kodboken uppdateras varje subram om 5-10 ms.
Analysdelen av LPAS-kodaren utför en LPC-analys av den inkommande talsignalen s(n) och utför även en excitationsanalys. lO 15 20 25 30 519 552 5' LPC-analysen utförs av ett LPC-analysfilter 10. Filtret mottager talsignalen s(n) och bildar en parametrisk modell av denna signal på rambasis. Modelparametrarna väljs för minimering av energin av en residualvektor som bildas genom skillnaden mellan en faktisk talramvektor och motsvarande signalvektor alstrad av modellen; Modellpara- metrarna representeras av analysfiltrets 10 filterkoefficienter. Dessa filterkoefficienter definierar filtrets överföringsfunktion A(z). Eftersom syntesfiltret 12 har enqöverförings- funktion som åtminstone approximativt är lika med 1/A(z) kommer dessa filterkoeffici- enter även att styra syntesfiltret 12, såsom indikeras av den streckade kontrolledning- en.
Excitationsanalysen utförs för bestämning av den kombination av fast kodboksvektor (kodboksindex), förstärkning gp, adaptiv kodboksvektor (lag) och förstärkning gA som resulterar i den syntetiska signalvektor {š(fl)} SOm bäst passar ihop med signalvektorn {s(n)} (här betecknar { } en uppsättning sampel som bildar en vektor eller ram). Detta görs i en uttömmande sökning som testar alla möjliga kombinationer av dessa parametrar (suboptimala sökscheman, i vilka vissa parametrar bestäms oberoende av de andra parametrarna och sedan hålls fasta under sökningen av de återstående parametrarna är även möjliga). För testning av hur nära en syntetisk vektor {š(fl)} ligger motsvarande talvektor {s(n)} kan energin av skillnadsvektorn {e(n)} (bildad i en adderare 26) beräknas i en energiberäknare 30. Det är dock effektivare att betrakta energin av en viktad felsignalvektor {ew(n)}, i vilken felen har omfördelats på sådant sätt att stora fel maskeras av frekvensband med stor amplitud. Detta görs i viktningsfilt- ret 28.
Modifieringen av den enkanaliga LPAS-kodaren i figur 1 till en flerkanalig LPAS- kodare i enlighet med föreliggande uppfinningen kommer nu att beskrivas under hänvisning till figurerna 2-13. En tvåkanalig (stereo) talsignal kommer att antas, men samma principer kan även användas för fler än två kanaler.
Figur 2 är ett blockschema av en utföringsforrn av analysdelen av en flerkanalig LPAS- kodare i enlighet med föreliggande uppfinning. l figur 2 är insignalen nu en flerkanalig signal, såsom indikeras av signalkomponenterna s1(n), s2(n). LPC-analysfiltret 10 ifigur 1 har ersatts med ett LPC-analysfilterblock 10M med en matrisvärd överföringsfunktion lO 15 20 25 30 519 552 6 A(z). Detta block kommer att beskrivas i detalj under hänvisning till figur 5. På liknande sätt ersätts adderaren 26, viktningsfiltret 28 och energiberäknaren 30 av motsvarande flerkanaliga block 26M, 28M respektive 3OM. Dessa block beskrivs i detalj i figurerna 4, 6 respektive 7.
Figur 3 är ett blockschema av en utföringsfonn av syntesdelen av en flerkanalig LPAS- talkodare i enlighet med föreliggande uppfinning. En flerkanalig avkodare kan också bildas av en sådan syntesdel. Här har LPC-syntesfiltret 12 i figur 1 ersatts med ett LPC-syntesfilterblock 12M med en matnsvärd överföringsfunktion A'1(z), som åtmin- stone approximativt är lika med inversen av A(z) (såsom indikerats av notationen).
Detta block kommer att beskrivas i detalj under hänvisning till figur 8. På liknande sätt ersätts adderaren 22, den fasta kodboken 16, förstärkningselementet 20, fördröjnings- elementet 24, den adaptiva kodboken 14 och förstärkningselementet 18 av motsva- rande flerkanaliga block 22M, 16M, 24M, 14M respektive 18M. Dessa block beskrivs i detalj i figur 4 samt 9-11.
Figur 4 är ett blockdiagram som illustrerar en modifiering av en enkanalig signaladde- rare till ett flerkanaligt signaladderingsblock. Detta är den enklaste av modifieringarna, eftersom den endast innebär en ökning av antalet adderare till antalet kanaler som skall kodas. Endast signaler som svarar mot samma kanal adderas (ingen inter- kanalbehandling).
Figur 5 är ett blockschema som illustrerar en modifiering av ett enkanaligt LPC- analysfilter till ett flerkanaligt LPC-analysfilterblock. I det enkanaliga fallet (övre delen av figur 5) används en prediktor P(z) för prediktering av en modellsignal som subtrahe- ras från talsignalen s(n) i en adderare 50 för alstring av en residualsignal r(n). I det flerkanaliga fallet (nedre delen av fig. 5) finns två sådana prediktorer P11(z) och P22(z) samt två adderare 50. Ett sådant flerkanaligt LPC-analysblock skulle dock endast behandla de två kanalerna som fullkomligt oberoende och skulle ej utnyttja inter- kanalredundansen. För att utnyttja denna redundans finns även två inter- kanalprediktorer P1g(z) och P21(z) samt två ytterligare adderare 52 anordnade. Genom addering av inter-kanalprediktioner till intra-kanalaprediktionerna i adderarna 52, erhålls noggrannare prediktioner, vilket reducerar variansen (felet) i residualsignalerna 10 15 20 25 519 552 7 r1(n), r2(n). Syftet med den flerkanaliga prediktom som bildas av prediktorerna P11(z), P22(z), P12(z), P21(z) är att minimera summan av r1(n)2+r2(n)2 över en talram. Predikto- rema (vilka ej behöver vara av samma ordning) kan beräknas genom användning av flerkanaliga utvidgningar av känd linjär prediktionsanalys. Ett exempel finns i [9], som beskriver en på reflektionskoefficienter baserad prediktor. Prediktionskoefficienterna kodas effektivt med en flerdimensionell vektorkvantiserare, företrädesvis efter trans- formering till en lämplig domän, t.ex. LSF-domänen (LSF = Line Spectral Frequency).
Matematiskt kan LPC-analysfilterblocket representeras (i z-domänen) av: (Ri _ (SÅZ) " I)11(Z)S1(Z)' Pi2(Z)S2 Rim ' S42) - P21 S. - P22 (zßziz) 1_P11(Z) _P12(Z) S1(Z) _ 1 O PUÜ) PIÄZ) S1(Z) _ Jaro) Halo) ska " 0 1 ' Pzliz) fw) Sziz) ' ska _ w) (E _ pwíSz w] _ AÄSZ (2)) här betecknar E enhetsmatrisen) eller i kompakt vektornotation: R(2) = A(2)S(2) Av dessa uttryck framgår att antalet kanaler kan ökas genom ökning av dimensionali- teten för vektorerna och matriserna.
Figur 6 är ett blockschema som illustrerar en modifiering av ett enkanaligt viktningsfilter till ett flerkanaligt viktningsfilterblock. Ett enkanaligt viktningsfilter 28 har i typfallet en överföringsfunktion med formen: A(z) Wtzbm där ß är en konstant, i typfallet i intervallet 0.8-1.0. En mera generell form utgörs av 10 15 20 25 30 519 552 8 A(z/a) W(z) z Arz/ß) där orzß är en annan konstant, i typfallet också i intervallet 8-1.0. En naturlig modifle_ ring till flerkanalsfallet är: W(z) = A°1(z/ ß)A(z / a) där W(z), A'1(z) och A(z) nu är matrisvärda. En mera flexibel lösning, som illustreras i figur 5, använder faktorer a och b (svarande mot G Och ß ovan) för intra-kanalviktning och faktorer c och d för inter-kanalviktning (alla faktorerna ligger i typfallet i intervallet 0.8-1.0). Ett sådant viktningsfilterblock kan matematisk uttryckas som: A-*lle/b) ßurz/dwAurz/a) Ane/c) A-'zlrz/d) Ane/b) Ane/c) Anrz/a) W(z) = L Av detta uttryck framgår att antalet kanaler kan ökas genom ökning av dimensionalite- ten av matriserna och införande av ytterligare faktorer.
Figur 7 är ett blockschema som illustrerar en modifiering av en enkanalig energiberäk- nare till ett flerkanaligt energiberäkningsblock. I enkanalsfallet bestämmer energibe- räknaren 12 summan av kvadraterna av de individuella samplen i den viktade felsig- nalen ew(n) av en talram. I flerkanalsfallet bestämmer energiberäknaren 12M på i liknande sätt energin av en ram av varje komponent ew1(n), ew2(n) i element 70, och adderar dessa energier i adderaren 72 för erhållande av den totalt energin Emr.
Figur 8 är ett blockschema som illustrerar en modifiering av ett enkanaligt LPC- syntesfilter till ett flerkanaligt LPC-syntesfilterblock. I den enkanaliga kodaren i figur bör excitationssignalen i(n) i idealfallet vara lika med residualsignalen r(n) från det enkana- liga analysfiltret i den övre delen av figur 5. Om detta villkor är uppfyllt kommer ett syntesfilter med överföringsfunktionen 1/A(z) att alstra en skattning š-(fl) SOm är "ka med talsignalen s(n). På liknande sätt bör i den flerkanaliga kodaren excitationssigna- len i1(n), i2(n) i idealfallet vara lika med residualsignalen r1(n), r2(n) i den nedre delen av figur 5. l detta fall utgörs modifieringen av syntesfiltret 12 i figur 1 av ett syntesfilter- 10 15 20 25 30 519 552 q block 12M med en matrisvärd överföringsfunktion. Detta block bör ha en överförings- funktion som åtminstone approximativt utgörs av (matris) inversen A'1(z) av den matrisvärda överföringsfunktionen A(z) av analysblocket i flgur 5. Matematiskt kan syntesblocket uttryckas (i z-domänen) som: (S.],[*f'~ Amziymzq S42) Awz) Aßzrz) A(z) eller i kompakt vektomotation: S(2) = A'1(2)l(2) Av dessa uttryck framgår att antalet kanaler kan ökas genom ökning av dimensionali- teten av vektorerna och matriserna.
Figur 9 är ett blockschema som illustrerar en modifiering av en enkanalig fast kodbok till ett flerkanaligt fast kodboksblock. Den enda fasta kodboken i enkanalsfallet ersätts formellt med en fast multi-kodbok 16M. Eftersom båda kanalerna bär samma typ av signal är det i praktiken tillräckligt att ha endast en fast kodbok och att plocka olika excitationer f1(n), f2(n) för de två kanalerna ur denna enda kodbok. Den fasta kodboken kan, till exempel, vara av algebraisk typ, se [12]. Vidare ersätts det enda förstärkningselementet 20 i enkanalsfallet av ett förstärkningsblock 20M innehållande flera förstärkningselement. Matematiskt kan förstärkningsblocket uttryckas (i tidsdo- mänen) som: [ui(")j=(gn O uzÜl) O gm eller i kompakt vektomotation: I1(n)= gFfUI) 10 15 20 25 5 1 9 5 5 2 lo Ur dessa uttryck framgår att antalet kanaler kan ökas genom ökning av dlmensionali- teten av vektorerna och matriserna.
Figur 10 är ett blockschema som illustrerar en modifiering av ett enkanaligt fördröj- ningselement till ett flerkanaligt fördröjningselementblock. I detta fall är ett fördröjnings- element anordnat för varje kanal. Alla signaler fördröjs med subramlängden N.
Figur 11 är ett blockschema som illustrerar en modifiering av ett enkanaligt långtids- prediktorsyntesblock till ett flerkanaligt långtidsprediktorsyntesblock. l enkanalsfallet kan kombinationen av den adaptiva kodboken 14, fördröjningselementet 24 och förstärkningselementet 18 betraktas som en långtidsprediktor LTP. Verkan av dessa tre block kan matematiskt uttryckas (i tidsdomänen) som: v(n) = 2101 - lag) = glåflflgfiín) där å betecknar en tidsskiftoperator. Excitationen v(n) är alltså en skalad (med gA), fördröjt (med lag) version av innovationen i(n). l flerkanalsfallet förekommer olika fördröjningar lag", lagg; för de enskilda komponenter i1(n), l2(n), och det förekommer även korsförbindelser mellan i1(n), i2(n) med separata fördröjningar Iag12, |ag21 för modellering av inter-kanalkorrelation. Vidare kan de fyra signalerna ha olika förstärk- ningar gm, gAzz, gmz, gm. Matematiskt kan verkan av det flerkanaliga långtidspredik- torsyntesblocket uttryckas (i tidsdomänen) som: (Vi = (gfniíiw _lag11) + gAlzl-z (Vi _ lagifi) V2 (n) gAzzl-z (n _ lagzz) + gAzzii (n " lagzl) (gar gA12)®[å(lÛgn) åaagrflj (ÜÜÜ gfm gAzz (Klaga) âuagzz) 1.2 (n) eller i kompaktvektornotation: v(n) = [gA ® â]i(n) lO 15 20 25 30 519 552 ll där _ ® betecknar eiementvis matrismultiplikation, och ä betecknar en matrisvärd tidsskiftoperator.
Av dessa uttryck framgår att antalet kanaler kan ökas genom ökning av dimensionali- teten av vektorerna och matriserna. För uppnående av lägre komplexitet eller lägre bithastighet kan gemensam kodning av fördröjningar och förstärkningar användas.
Fördröjningen kan exempelvis deltakodas, och i extremfallet behöver endast en enda fördröjning (lag) användas. Förstärkningarna kan vektorkvantiseras eller kodas differentiellt.
Figur 12 är ett blockschema som illustrerar en annan utföringsform av ett flerkanaligt LPC-analysfilterblock. i denna utföringsform förbehandlas insignalen s1(n), s2(n) genom bildande av summa- och skillnadssignalerna s1(n)+s2(n) och s1(n)-s2(n) i adderare 54. Därefter leds dessa summa- och skillnadssignaler till samma analysfilter- block som i figur 5. Detta gör det möjligt att ha olika bitallokeringar mellan summa- och skillnadssignalerna, eftersom summasignalen förväntas vara mera komplex än skillnadssignalen. Summasignalprediktorn P11(z) kommer därför i typfallet att vara av högre ordning än skillnadssignalprediktorn P22(z). Vidare kommer summasignaipre- diktorn att erfordra en högre bithastighèt och en finare kvantiserare. Bitaiiokeringen mellan summa- och skiilnadskanaiema kan vara antingen fast eller adaptiv. Eftersom summa- och skillnadssignalerna kan betraktas som en partiell ortogonalisering kommer även korskorreiationen mellan summa- och skillnadssignalerna att reduceras, vilket leder till enklare (lägre ordning) prediktorer P12(z), P21(z). Detta kommer även att reducera den erforderliga bithastigheten.
Figur 13 är ett blockschema som illustrerar en utföringsforrn av ett flerkanaligt LPC- syntesfilterbiock som svarar mot analysfilterblocket i figur 12. Här efterbehandlas utsignaierna från ett syntesfilterbiock i enlighet med figur 8 i adderare 82 för återvinning av skattningarna §1(n), š2(n) ur skattningarna av summa- och skillnadssignalerna.
De utföringsformer som beskrivits under hänvisning till figurerna 12 och 13 är ett speciaifall av en speciell teknik kallad "matrixing". Den generella idén bakom 10 15 20 25 30 519 552 ll ”matrixing” är att transformera den ursprungliga vektorvärda insignalen till en ny vektorvärd signal, vars komponentsignaler är mindre korrelerade (mera ortogonala) än den ursprungliga signalens komponenter. Typiska exempel på transformationer är Walsh-transformer.
Hadamard- och Exempelvis ges ^ Hadamard- transformationsmatriser av ordning 2 och 4 av: Det noteras att Hadamard-matrisen H2 ger utföringsformen i figur 12. Hadamard- matrisen H4 skulle användas vid 4-kanalig kodning. Fördelen med denna typ av "matrixing" eller matristransforrnering är att komplexiteten och den erforderliga bithastigheten för kodaren reduceras utan behov av överföring av information avseen- de transforrnationsmatrisen till avkodaren, eftersom matrisformen är fix (en fullständig ortogonalisering av insignalerna skulle erfordra tidsvarierande transfonnationsmatriser, vilka skulle behöva sändas till avkodaren, varigenom den erforderliga bittakten skulle ökas). Eftersom transformationsmatrisen är fix kommer även dess invers som används i avkodaren, att vara fix och kan förberäknas och lagras i avkodaren.
En variation på den ovan beskrivna summa- och skillnadstekniken är att koda den ”vänstra” kanalen och skillnaden mellan ”vänstra” och ”högra” kanalen multiplicerad med en förstärkningsfaktor, dvs.
Cm = un) CZ (n) = L(n) - gain - R(n) där L, R är den vänstra och högra kanalen, C1, Cg är de resulterande kanalema som skall kodas och ”gain” är en skalfaktor. Skalfaktorn kan vara fast och känd vid avkoda- ren eller kan beräknas eller predikteras, kvantiseras och sändas till avkodaren. Efter avkodning av C1, Cg vid avkodaren rekonstrueras den vänstra och högra kanalen i enlighet med: 10 15 20 519 552 B LW) = G1 (n) R(n) = (Å(n) - Û2(n))/ gain där "^" betecknar skattade kvantiteter. Även denna teknik kan betraktas som ett specialfall av matristransformering (matrixing) där transfonnationsmatrisen lges av 1 0 1 - gain Även denna teknik kan utvidgas till fler än två dimensioner. i det generella fallet ges transformationsmatrisen av 1 O 0 O 1 - gainn O O 1 - gainn - gainæ O 1 - gaínm - gainm - gainNN där N betecknar antalet kanaler.
I det fall att matristransformering (matrixing) används kan de resulterande ”kanalerna” vara mycket olika. Det kan därför vara önskvärt att behandla dem olika i viktningspro- cessen. I detta fall kan en mera generell viktningsmatris i enlighet med AMz/ßu) A"'I2J(AH Aluma) W(Z) =(A_121(Z/ß21) A-IZÅZ/ßzz) AnÜ/azl) AzzÜ/azz) användas. Här är elementen i matrisema fian an) och (ßn 1312) 0521 0522 ßzl ßzz lO 15 20 25 519 552 lll i typfallet i intervallet O.6-1.0. Ur dessa uttryck framgår att antalet kanaler kan ökas genom ökning av dimensionaliteten av viktningsmatrisen. I det generella fallet kan därför viktningsmatrisen skrivas som: A-luv (Z/ßw) A"2~(z/ß2N) frlwçz/ ßm) >< Arhle/ßn) A-Hze/ßu) Arfisrz/ßß) A'121(Z/ß21) A-lzflz/ßzz) A_l23(Z/ß23) Aqsflz/ßn) Adlsflz/ßn) A“l33(z/ß33) Ame 113m) A-“Nzrz/ ßm) Arlmrz/ ßm) Afimrnz/ ßNN) W(z) = AnÜ/an) AiÄZ/aiz) AisÜ/ais) Am (Z/auv) AziÜ/azi) A22 (Z/azz) AzsÜ/aza) AzN (Z/azrv) AaiÜ/asi) AuÜ/asz) AasÜ/aas) Asiv (Z/asiv) ANiÜ/aui) ANÄZ/Û-'NÛ AN: (Z/aNs) ANN (Z/ÜNN) där N betecknar antalet kanaler. Det noteras att alla de tidigare givna exemplen på viktningsmatriser är specialfall av denna mera generella matris.
Figur 14 är ett blockschema av en annan konventionell enkanalig LPAS-talkodare. Den väsentliga skillnaden mellan utföringsforrnerna i figur 1 och 14 är implementeringen av analysdelen. I figur 14 är ett långtidspredikterande (LTP) analysfilter 11 anordnat efter LPC-analysfiltret 10 för att ytterligare reducera redundansen i residualsignalen r(n).
Syftet med denna analys är att hitta ett sannolikt lag-värde i den adaptiva kodboken.
Endast lag-värden runt de sannolika lag-värdet kommer att undersökas (såsom indikeras av kodbok den streckade kontrolledningen till den adaptiva kodboken 14), vilket väsentligt reducerar sökprocedurens komplexitet.
Figur 15 är ett blockschema av en exempllfierande utföringsforrn av analysdelen av en flerkanalig LPAS-talkodare enlighet med föreliggande uppfinning. Här är LTP- analysfilterblocket 11M en flerkanalig modifiering av LTP-analysfiltret i Figur 14. Syftet med detta block är att hitta sannolika lag-värden (lag11, lagiz, lagzi, lagzz), vilket väsentligt kommer» att reducera sökprocedurens komplexitet, såsom kommer att beskrivas ytterligare nedan. 10 15 20 25 30 5 1 9 5 5 2 15 Figur 16 är ett blockschema av en exemplifierande utföringsform av syntesdelen av en flerkanalig LPAS-talkodare i enlighet med föreliggande uppfinning. Enda skillnaden mellan denna utföringsfonn och utföringsforrnen i figur 3 är lag-kontrolledningen från analysdelen till den adaptiva kodboken 14M.
Figur 17 är ett blockschema som illustrerar en modifiering av det enkanaliga LTP- analysfiltret 11 i figur 14 till det flerkanaliga LTP-analysfilterblocket 11M i figur 15. Den vänstra delen illustrerar ett enkanaligt LTP-analysfilter 11. Genom val av lämpligt lag- värde och förstärkningsvärde minimeras den kvadrerade summan av residualsignaler re(n), vilka är skillnaden mellan signalerna r(n) från LPC-analysfiltret 12 och de predikterade signalerna, över en ram. Det erhållna lag-värdet styr utgångspunkten för sökproceduren. Den högra delen av figur 17 illustrerar motsvarande flerkanaliga LTP- analysfilterblock 11M. Principen är densamma, men här är det energin för den totala residualsignalen som minimeras genom val av lämpliga värden på fördröjningarna lag11, lag12, lag21, lagg; och förstärkningsfaktorerna gm, gmz, gm, gm. De erhållna lag-värdena styr utgångspunkten för sökproceduren. Likheten mellan blocket 11M och den flerkanaliga långtidsprediktom 18M i figur 11 kan noteras.
Sedan nu modifleringen av olika element i en enkanalig LPAS-kodare till motsvarande block i en flerkanalig LPAS-kodare har beskrivits är det dags att diskutera sökprocedu- ren för att hitta optimala kodningsparametrar.
Den mest uppenbara och optimala sökmetoden är att beräkna den totala energin för det viktade felet för alla möjliga kombinationer av lag11, lag12, laggi, lagzz, gA11, 9A12, gA21, gAgg, två fasta kodboksindex, gm och gm, samt att välja den kombination som ger det lägsta felet såsom en representation av den aktuella talramen. Denna metod är dock mycket komplex, i synnerhet om antalet kanaler ökas.
En mindre komplex, suboptimal metod lämplig för utföringsformen i figurema 2-3 är följande algoritm (subtraktion av filterringning antages och nämns ej explicit), som även illustreras i figur 18; 10 15 20 25 30 519 552 16 A. Utför flerkanalig LPC-analys för en ram (t.ex. 20 ms) B. För varje subram (exempelvis 5 ms) utförs följande steg: B1. Utför en uttömmande (samtidig och fullständig) sökning av alla möjliga lag- värden i en sluten slingsökning; i B2. Vektorkvantisera LTP-förstärkningarna; B3. Subtrahera bidraget till excitationen från den adaptiva kodboken (för den just bestämda lag/förstärkningskombinationen) i den återstående sökningen i den fasta kodboken; B4. Utför en uttömmande sökning av fasta kodboksindex i en sluten slingsökning; B5. Vektorkvantisera fasta kodboksförstärkningar; B6. Uppdatera LTP.
En mindre komplex suboptimal metod lämplig för utföringsforrnen i figurerna 15-16 är följande algoritm (subtraktion av filterringning antages och nämns ej explicit), vilken även illustreras ifigur 19: A. Utför flerkanalig LPC-analys för en ram C. Bestäm (i öppen slinga) skattningar av fördröjningar (lags) i LTP-analys (en uppsättning skattningar för hela ramen eller en uppsättning för mindre delar av ramen, till exempel en uppsättning för varje halvram eller en uppsättning för varje subram) D. För varje subram utförs följande steg: D1. Sök intra-lag för kanal 1 (lagn) endast ett fåtal sampel (till exempel 4-16) runt skattningen; D2. Spara ett antal (till exempel 2-6) lag-kandidater; D3. Sök intra-lag för kanal 2 (laggg) endast ett fåtal sampel (till exempel 4-16) runt skattningen; D4. Spara ett antal (till exempel 2-6) lag-kandidater; D5. Sök inter-lag för kanal 1 - kanal 2 (lag12) endast ett fåtal sampel (till exempel 4 -16) runt skattningen; D6. Spara ett antal (till exempel 2-6) lag-kandidater; D7. Sök inter-lag för kanal 2 - kanal 1 (lag21) endast ett fåtal sampel (till exempel 4-16) runt skattningen; lO 15 20 25 30 519 552 I? D8. Spara ett antal (till exempel 2-6) lag-kandidater; D9. Utför en fullständig sökning endast för alla kombinationer av sparade lag- kandidater; D10. Vektorkvantisera LTP-förstärkningarna; D11. Subtrahera bidraget till excitationen från den adaptiva kodboken (för den just bestämda lag/förstärkningskombinationen) i den återstående sökningen i den fasta kodboken; D12. Sök den första fasta kodboken för att hitta några (till exempel 2-8) index- kandidater; D13. Spara indexkandidatema; D14. Sök den andra fasta kodboken för att hitta några (till exempel 2-8) index- kandidater; D15. Spara indexkandidaterna; D16. Utför en fullständig sökning endast för alla kombinationer av sparade in- dexkandidater för de båda fasta kodböckema; D17. Vektorkvantisera de fasta kodboksförstärkningama; D18. Uppdatera LTP. l den senast beskrivna algoritmen kan sökordningen för kanalerna omkastas från subram till subram.
Om matristransformering (matrixing) används är det att föredraga att alltid söka den ”dominerande” kanalen (summakanalen) först.
Trots att föreliggande uppfinning har beskrivits med hänvisning till talsignaler är det uppenbart att samma principer generellt kan tillämpas på flerkanaliga audiosignaler.
Andra typer av flerkanaliga signaler är även lämpliga för denna typ av datakompres- sion, till exempel flerpunktstemperaturrnätningar, seismiska mätningar, etc. Om beräkningskomplexiteten kan hanteras skulle i själva verket samma principer även kunna tillämpas på videosignaler. I detta fall kan tidsvariationen av varje pixel betraktas som en ”kanal”, och eftersom intilliggande pixels ofta är korrelerade, kan inter-pixel redundans utnyttjas för datakomprimeringssyften. 5 1 9 5 5 2 18 Fackmannen inser att olika modifieringar och förändringar kan göras vid föreliggande uppfinning utan awikelse från dess ram, som definieras av de bifogade patentkra- Ven . 10 15 20 25 30 [11 [2] [3] [4] [5] [7] [81 [9]
[10] 519 552 lfi REFERENSER A. Gersho, "Advances in Speech and Audio Compression", Proc. of the IEEE, Vol. 82, Nr. 6, s. 900-918, juni 1994 A. S. Spanias, "Speech Coding: A Tutorial Reviewi", Proc. of the IEEE, Vol 82, Nr. 10, s. 1541-1582, okt 1994 P. Noll, Wideband Speech and Audio Coding", IEEE Commun. Mag. Vol. 31, Nr. 11, s. 34-44, 1993 B. Grill et. al. "Improved MPEG-2 Audio Multi-Channel Encoding", 96"' Audio Engineering Society Convention, s. 1-9, 1994 W. R. Th. Ten Kate et. al. "Matrixing of Bit Rate Reduced Audio Signa|s", Proc.
ICASSP, Vol. 2, s. 205-208, 1992 M. Bosi et. al. "lSO/IEC MPEG-2 Advanced Audio Coding", 1015* Audio Engineering Society Convention, 1996 EP 0 797 324 A2, Lucent Technologies Inc. "Enhanced stereo coding method using temporal envelope shaping" WO90/16136, British Telecom. "Polyphonic coding" WO 97/04621, Robert Bosch Gmbh, "Process for reducing redundancy during the coding of multichannel signals and device for decoding redundancy reduced multichannel signals" M. Mohan Sondhi et. al. "Stereophonic Acoustic Echo Cancellation - An Overview of the Fundamental Problem", IEEE Signal Processing Letters, Vol. 2, Nr. 8, augusti 1995
[11]
[12] 5 1 9 5 5 2 20 P. Kroon, E. Deprettere, "A Class of Analysis-by-Synthesis Predictive Coders for High Quality Speech Coding at Rates Between 4.8 and 16 kbits/s", IEEE Journ. Sel. Areas Com., Vol SAC-6, Nr. 2, s. 353-363, feb 1988 C, Laflamme et. al., "16 Kbps Wideband Speech Coding Technique Based on Algebraic CELP", Proc. ICASSP, 1991, s. 13-16 v

Claims (26)

10 15 20 25 519 552 ll PATENTKRAV , . ~ . , i i _ . .
1. Flerkanalig signalkodare, kännetecknad av: en analysdel innehållande ett analysfilterblock (10M) med en första matrisvärd överföringsfunktion med åtminstone ett från noll skilt icke-diagonalt matriselement (-P12(Z), -P21(Z))š Och en syntesdel innehållande ett syntesfilterblock (12M) med en andra matrisvärd överföringsfunktion med åtminstone ett från noll skilt icke-diagonalt matriselement . Atziizii; varigenom både intra-kanal redundans och inter-kanal redundans reduceras vid linjär prediktiv analys-genom-syntessignalkodning_
2. Kodare enligt krav 1, kännetecknad av att den andra matrisvärda överföringsfunktio- nen utgörs av inversen av den första matrisvärda överföringsfunktionen.
3. Kodare enligt krav 1 eller 2, kännetecknad av ett flerkanaligt långtidsprediktorsyn- tesblock definierat av: bA®fihw> där 9A betecknat en förstärkningsmatris, ® betecknar elementvis matrismultiplikation, d betecknar en matrisvärd tidsskiftoperator, och i(n) betecknar en vektorvärd syntesfilterbIockexcitation_
4. Kodare enligt krav 1, 2 eller 3, kännetecknad av ett flerkanaligt viktningsfilterblock med en matrisvärd överföringsfunktion W(z) definierad av: lO 15 20 25 519 552 2.2 A142/ ßn) A142/ ßn) A142/ ßß) A342/ ßn) Afiflz / ßn) A-Bqz/ßn) A'*31(z/ ß,,) Afizu/ ßn) Aüflz/ ßß) A-'Mz / ßm) AÜA/(z/ßnv) A-laß/(Z/ßyv) >< A_1N1(.Z/,ÛN1) A_]N2(.Z/,ÛN2) AglNsøZ/ßbß) A4NA/(JZ/ßNN) W(z) = AnÜ/an) AizÜ/aiz) AisÜ/ais) Am/(Z/auv) A21 (Z/azi) AzzÛ/azz) AzsÜ/azs) AznÜ/azlv) AsiÜ/asi) Asflz/asz) A33 (Z/aas) A31v (Z/asN) ANÅZ/azvl) ANÄZ/arvz) Am (z/azvz) ANN (Z/aNN) där N betecknar antalet kanaler, Af, i=1..N, j=1..N betecknar överföringsfunktioner av enskilda matriselement i analysfilterblocket, A1; ,i=1...N, j=1 ...N betecknar överföringsfunktioner av enskilda matriselement i syntesfilterblocket, och Gig. ßij, i=1...N, j=1 ...N är fördefinierade konstanter.
5. Kodare enligt krav 4, kännetecknat av ett viktningsfilterblock med matrisvärd överföringsfunktion W(z) definierad av: W(z) = A"(z/,ß)A(z/a) där A betecknar den matrisvärde överföringsfunktionen för analysfilterblocket, A4 betecknar den matrisvärda överföringsfunktionen för syntesfilterblocket, och a, ß är fördefinierade konstanter.
6. Kodare enligt något av föregående krav, kännetecknad av multipla fasta kodboks- index och motsvarande fasta kodboksförstärkningar.
7. Kodare enligt något av föregående krav, kännetecknad av organ för matristransfor- mering av flerkanaliga insignaler före kodning. 10 15 20 25
8. Kodare enligt krav 7, kännetecknad av att nämnda organ för matristransformering definierar en transformeringsmatris av Hadamard-typ.
9. Kodare enligt krav 7, kännetecknad av att nämnda matristransformeringsorgan definierar en transformeringsmatris med formen: 1 0 0 0 1 - gainn O 0 1 - gain” - gain” 0 1 - gainm - gainm - gainNN där gainrj, i=2. . _ N, i=2. ._ N betecknar skalfaktorer, och N betecknar antalet kanaler som skall kodas.
10. Flerkanalig linjär prediktiv analys-genom-syntes signalavkodare, kännetecknad av: ett syntesfilterblock (12M) med en matrisvärd överföringsfunktion med åtmin- stone ett från noll skilt icke-diagonalt matriselement (A_112(z), A'121(z)).
11. Avkodare enligt krav 10, kännetecknad av ett flerkanaligt långtidsprediktorsyntes- block definierat av: [gi ® Ûliln) där gA betecknar en förstärkningsmatris, ® betecknar elementvis matrjsmultiplikation, ä betecknar en matrisvärd tidsskiftoperator, och i(n) betecknar en vektorvärd syntesfilterblockexcitation_
12. Avkodare enligt krav 10 eller 11, kännetecknad av multipla fasta kodboksindex och motsvarande fasta kodboksförstärkningar. lO 15 20 25 519 552,ff§lI§“¿,f . g
13. Sändare innehållande en flerkanalig talkodare, kännetecknad av: en talanalysdel innehållande ett analysfilterblock (10M) med en första matris- värd överföringsfunktion med åtminstone ett från noll skilt icke-diagonalt matriselement (-P12(z), -P21(z)); och en talsyntesdel innehållande ett syntesfilterblock (12M) med en andra matris- värd överföringsfunktion med åtminstone ett från noll skilt icke-diagonalt matriselement . A*21>: varigenom både intra-kanalredundansen och inter-kanalredundansen reduceras vid linjär prediktiv analys-genom-syntes talsignalkodning.
14. Sändare enligt krav 13, kännetecknad av att den andra matrisvärda överförings- funktionen utgörs av inversen av den första matrisvärda överföringsfunktionen.
15. Sändare enligt krav 13 eller 14, kännetecknad av ett flerkanaligt långtidsprediktor- syntesblock definierat av: [gl ® Ûlitn) där gA betecknar en förstärkningsmatris, ® betecknar elementvis matrismultiplikation, ä betecknar en matrisvärd tidsskiftoperator, och i(n) betecknar en vektorvärd talsyntesfilterblockexcitation.
16. Sändare enligt krav 13, 14 eller 15, kännetecknad av ett flerkanaligt viktningsfilter- block med en matrisvärd överföringsfunktion W(z) definierad av: 10 15 20 25 519 552 zs' Afimz/ßu) A",2(z/ß,,) A-'lkz/ßß) A-lzflz/ßzl) A422 (Z/ßn) A'123(Z/ß23) A-lsflz/ßn) A432 (Z/ßn) A_l33(Z/ß33) A_l11v(Z/ßlN) A-'ZN (z / ßw) A"3~(z/ß3,,) >< A'1N1('Z/ßN1) A~|N2(.Z/,ÛN2) A-INÅ-Z/ßm) A_lNN(..Z/ßNN) W(z) = AnÜ/an) AlzÜ/alz) AisÜ/ais) Am/(Z/aiiv) A21(Z/az1) A22 (Z/azz) AzÄz/azs) AzN (Z/aziv) Asflz/asi) AsÄZ/asz) AsÄz/ass) Aazl/(Z/as/v) ANÅZ/aui) ANzÜ/arvz) ANsÜ/azvs) ANN (Z/aNN) där N betecknar antalet kanaler, Aij, i=1..N, j=1..N betecknar överföringsfunktionerna för enskilda matrisele- ment i analysfilterblocket, A41,- ,i=1...N, j=1 ...N betecknar överföringsfunktioner av enskilda matriselement i syntesfilterblocket, och GU. ßij, i=1 . . . N, j=1 ...N är förutbestämda konstanter.
17. Sändare enligt krav 16, kännetecknat av ett viktningsfllterblock med en matrisvärd överföringsfunktion W(z) definierad av: W(z) = A-l (z/ß)A(z/a) där « A betecknar den matrisvärda överföringsfunktionen för talanalysfilterblocket, A4 betecknar den matrisvärda överföringsfunktionen för talsyntesfilterblocket, och o, ß är förutbestämda konstanter.
18. Sändare enligt något av föregående krav 13-17, kännetecknad av multipla fasta kodboksindex och motsvarande fasta kodboksförstärkningar.
19. Sändare enligt något av föregående krav 13-18, kännetecknad av organ för matristransformering av flerkanaliga insignaler före kodning. lO 15 20 25 519 552 lb
20. Sändare enligt krav 19, kännetecknad av att nämnda matristransformeringsorgan definierar en transformeringsmatris av Hadamard-typ.
21. Sändare enligt krav 19, kännetecknad av att nämnda matristransformeringsorgan definierar en transformeringsmatris med formen: 1 0 0 --- 0 1 - gain” O 0 1 - gain” - gain” 0 1 - gainNz - gainm - gaínNN där gainij, i=2...N, j=2...N betecknar skalfaktorer, och N betecknar antalet kanaler som skall kodas.
22. Mottagare innehållande en flerkanalig linjär prediktlv analys-genom-syntes talavkodare, kännetecknad av: ett talsyntesfilterblock (12M) med en matrisvärd överföringsfunktion med åtminstone ett från noll skilt icke-diagonalt matriselement (A'112(z), A'121(z)).
23. Mottagaren enligt krav 22, kännetecknad av ett flerkanaligt långtidsprediktorsyn- tesblock definierat av: [gA ® a]i(n) där gA betecknar en förstärkningsmatris ® betecknar elementvis matrismultiplikation, ä betecknar en matrisvärd tidsskiftoperator, och i(n) betecknar en vektorvärd talsyntesfiIterblockexcitation.
24. Mottagare enligt krav 22 eller 23, kännetecknad av multipla fasta kodboksindex och motsvarande fasta kodboksförstärkningar. 5 10 15 20 25 30 519 552 9.? ; . f 1 f >
25. Flerkanaligt linjärt prediktivt analys-genom-syntes talkodningsförfarande, känne- tecknat av flerkanalig linjär prediktiv kodningsanalys av en talram, samt av utförande av följande steg för varje subram av denna talram: uttömmande sökning av både inter- och intra-kanalfördröjningar (lags); vektorkvantisering av långtidsprediktorförstärkningar; subtrahering av den bestämda adaptiva kodboksexcitationen; uttömmande sökning av fast kodbok; vektorkvantisering av fasta kodboksförstärkningar; uppdatering av långtidsprediktor.
26. Flerkanaligt linjärt prediktivt analys-genom-syntes talkodningsförfarande, känne- tecknat av flerkanalig linjär prediktiv kodningsanalys av en talram, samt av utförande av följande steg för varje subram i denna talram: skattning av både inter- och intra-kanalfördröjningar (lags); bestämning av både inter- och intra-kanalfördröjningskandidater kring skatt- ningarna; lagring av fördröjningskandidater; uttömmande sökning av lagrade inter- och intra-kanalfördröjningskandidater; vektorkvantisering av långtidsprediktorförstärkningar; subtrahering av den bestämda adaptiva kodboksexcitationen; bestämning av fixa kodboksindexkandidater; lagring av indexkandidater; uttömmande sökning av de lagrade indexkandidaterna; vektorkvantisering av fasta kodboksförstärkningar; uppdatering av långtidsprediktor.
SE9803321A 1998-09-30 1998-09-30 Flerkanalig signalkodning och -avkodning SE519552C2 (sv)

Priority Applications (10)

Application Number Priority Date Filing Date Title
SE9803321A SE519552C2 (sv) 1998-09-30 1998-09-30 Flerkanalig signalkodning och -avkodning
AU11921/00A AU756829B2 (en) 1998-09-30 1999-09-15 Multi-channel signal encoding and decoding
CN998115908A CN1132154C (zh) 1998-09-30 1999-09-15 多信道信号编码和解码
KR10-2001-7004041A KR100415356B1 (ko) 1998-09-30 1999-09-15 다중 채널 신호 인코딩 및 디코딩 방법 및 장치
EP99969816A EP1116223B1 (en) 1998-09-30 1999-09-15 Multi-channel signal encoding and decoding
PCT/SE1999/001610 WO2000019413A1 (en) 1998-09-30 1999-09-15 Multi-channel signal encoding and decoding
DE69940068T DE69940068D1 (de) 1998-09-30 1999-09-15 Kodierung und dekodierung mehrkanaliger signale
CA002344523A CA2344523C (en) 1998-09-30 1999-09-15 Multi-channel signal encoding and decoding
JP2000572833A JP4743963B2 (ja) 1998-09-30 1999-09-15 複数チャネル信号の符号化及び復号化
US09/407,599 US6393392B1 (en) 1998-09-30 1999-09-28 Multi-channel signal encoding and decoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE9803321A SE519552C2 (sv) 1998-09-30 1998-09-30 Flerkanalig signalkodning och -avkodning

Publications (3)

Publication Number Publication Date
SE9803321D0 SE9803321D0 (sv) 1998-09-30
SE9803321L SE9803321L (sv) 2000-03-31
SE519552C2 true SE519552C2 (sv) 2003-03-11

Family

ID=20412777

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9803321A SE519552C2 (sv) 1998-09-30 1998-09-30 Flerkanalig signalkodning och -avkodning

Country Status (10)

Country Link
US (1) US6393392B1 (sv)
EP (1) EP1116223B1 (sv)
JP (1) JP4743963B2 (sv)
KR (1) KR100415356B1 (sv)
CN (1) CN1132154C (sv)
AU (1) AU756829B2 (sv)
CA (1) CA2344523C (sv)
DE (1) DE69940068D1 (sv)
SE (1) SE519552C2 (sv)
WO (1) WO2000019413A1 (sv)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519981C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519985C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519976C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
ATE439666T1 (de) * 2001-02-27 2009-08-15 Texas Instruments Inc Verschleierungsverfahren bei verlust von sprachrahmen und dekoder dafer
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1564650A1 (en) * 2004-02-17 2005-08-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for transforming a digital audio signal and for inversely transforming a transformed digital audio signal
US8078475B2 (en) 2004-05-19 2011-12-13 Panasonic Corporation Audio signal encoder and audio signal decoder
JP4950040B2 (ja) * 2004-06-21 2012-06-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
US7475011B2 (en) * 2004-08-25 2009-01-06 Microsoft Corporation Greedy algorithm for identifying values for vocal tract resonance vectors
BRPI0516201A (pt) * 2004-09-28 2008-08-26 Matsushita Electric Industrial Co Ltd aparelho de codificação escalonável e método de codificação escalonável
JP4963965B2 (ja) * 2004-09-30 2012-06-27 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法
SG158868A1 (en) * 2005-01-11 2010-02-26 Agency Science Tech & Res Encoder, decoder, method for encoding/decoding, computer readable media and computer program elements
WO2006085586A1 (ja) * 2005-02-10 2006-08-17 Matsushita Electric Industrial Co., Ltd. 音声符号化におけるパルス割当方法
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
CN101124740B (zh) * 2005-02-23 2012-05-30 艾利森电话股份有限公司 多声道音频信号编码和解码的方法和装置和音频传送系统
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
KR101259203B1 (ko) * 2005-04-28 2013-04-29 파나소닉 주식회사 음성 부호화 장치와 음성 부호화 방법, 무선 통신 이동국 장치 및 무선 통신 기지국 장치
DE602006011600D1 (de) * 2005-04-28 2010-02-25 Panasonic Corp Audiocodierungseinrichtung und audiocodierungsverfahren
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
FR2901433A1 (fr) * 2006-05-19 2007-11-23 France Telecom Conversion entre representations en domaines de sous-bandes pour des bancs de filtres variant dans le temps
US7797155B2 (en) * 2006-07-26 2010-09-14 Ittiam Systems (P) Ltd. System and method for measurement of perceivable quantization noise in perceptual audio coders
US8983830B2 (en) 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
JPWO2008132826A1 (ja) * 2007-04-20 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置およびステレオ音声符号化方法
JPWO2008132850A1 (ja) * 2007-04-25 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8374883B2 (en) * 2007-10-31 2013-02-12 Panasonic Corporation Encoder and decoder using inter channel prediction based on optimally determined signals
KR101086304B1 (ko) * 2009-11-30 2011-11-23 한국과학기술연구원 로봇 플랫폼에 의해 발생한 반사파 제거 신호처리 장치 및 방법
WO2011072729A1 (en) * 2009-12-16 2011-06-23 Nokia Corporation Multi-channel audio processing
TWI713018B (zh) 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
WO2017049396A1 (en) 2015-09-25 2017-03-30 Voiceage Corporation Method and system for time domain down mixing a stereo sound signal into primary and secondary channels using detecting an out-of-phase condition of the left and right channels
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
CN109427338B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号的编码方法和编码装置
CN110660400B (zh) * 2018-06-29 2022-07-12 华为技术有限公司 立体声信号的编码、解码方法、编码装置和解码装置
WO2020009082A1 (ja) * 2018-07-03 2020-01-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
EP3719799A1 (en) 2019-04-04 2020-10-07 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1165641B (it) * 1979-03-15 1987-04-22 Cselt Centro Studi Lab Telecom Sintetizzatore numerico multicanale della voce
US4636799A (en) 1985-05-03 1987-01-13 United Technologies Corporation Poled domain beam scanner
US4706094A (en) 1985-05-03 1987-11-10 United Technologies Corporation Electro-optic beam scanner
GB2211965B (en) * 1987-10-31 1992-05-06 Rolls Royce Plc Data processing systems
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
JP3112462B2 (ja) * 1989-10-17 2000-11-27 株式会社東芝 音声符号化装置
ATE133820T1 (de) * 1990-11-05 1996-02-15 Philips Electronics Nv Digitales übertragungssystem, gerät zur aufnahme und/oder wiedergabe und sender sowie empfänger zur anwendung im übertragungssystem
US5208786A (en) * 1991-08-28 1993-05-04 Massachusetts Institute Of Technology Multi-channel signal separation
WO1993010571A1 (en) 1991-11-14 1993-05-27 United Technologies Corporation Ferroelectric-scanned phased array antenna
JPH0677840A (ja) * 1992-08-28 1994-03-18 Fujitsu Ltd ベクトル量子化装置
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
TW272341B (sv) * 1993-07-16 1996-03-11 Sony Co Ltd
JP3528260B2 (ja) * 1993-10-26 2004-05-17 ソニー株式会社 符号化装置及び方法、並びに復号化装置及び方法
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP3435674B2 (ja) * 1994-05-06 2003-08-11 日本電信電話株式会社 信号の符号化方法と復号方法及びそれを使った符号器及び復号器
DE19526366A1 (de) * 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
US6307962B1 (en) * 1995-09-01 2001-10-23 The University Of Rochester Document data compression system which automatically segments documents and generates compressed smart documents therefrom
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5924062A (en) * 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search

Also Published As

Publication number Publication date
DE69940068D1 (de) 2009-01-22
EP1116223A1 (en) 2001-07-18
US6393392B1 (en) 2002-05-21
EP1116223B1 (en) 2008-12-10
WO2000019413A1 (en) 2000-04-06
CN1320258A (zh) 2001-10-31
CA2344523A1 (en) 2000-04-06
CA2344523C (en) 2009-12-01
CN1132154C (zh) 2003-12-24
AU756829B2 (en) 2003-01-23
KR100415356B1 (ko) 2004-01-16
SE9803321D0 (sv) 1998-09-30
SE9803321L (sv) 2000-03-31
JP2002526798A (ja) 2002-08-20
KR20010099659A (ko) 2001-11-09
JP4743963B2 (ja) 2011-08-10
AU1192100A (en) 2000-04-17

Similar Documents

Publication Publication Date Title
SE519552C2 (sv) Flerkanalig signalkodning och -avkodning
US8428958B2 (en) Apparatus and method of encoding and decoding signals
CA2524243C (en) Speech coding apparatus including enhancement layer performing long term prediction
EP0684705B1 (en) Multichannel signal coding using weighted vector quantization
JP7008716B2 (ja) サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
KR100885192B1 (ko) 개선된 성능의 예측 기반의 멀티 채널 복원 방법, 장치 및 그 구성 요소
USRE36646E (en) Speech coding system utilizing a recursive computation technique for improvement in processing speed
US6240382B1 (en) Efficient codebook structure for code excited linear prediction coding
US6122608A (en) Method for switched-predictive quantization
NO342080B1 (no) Koder, dekoder og fremgangsmåter for koding og dekoding av datasegmenter som representerer en datastrøm i tidsdomenet.
JP3254687B2 (ja) 音声符号化方式
KR20110020846A (ko) 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
AU2014295167A1 (en) In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
JPH04363000A (ja) 音声パラメータ符号化方式および装置
GB2235354A (en) Speech coding/encoding using celp
CN110444217B (zh) 解码装置、解码方法、记录介质
US6484139B2 (en) Voice frequency-band encoder having separate quantizing units for voice and non-voice encoding
MX2007014570A (es) Codificacion predictiva de una senal de canales multiples.
KR20150032736A (ko) 복호 방법, 복호 장치, 프로그램 및 그 기록매체
US6034632A (en) Signal coding method and apparatus
EP1706866A1 (en) Audio coding based on block grouping
Choi A fast determination of stochastic excitation without codebook search in CELP coder
Jbira et al. Low delay coding of wideband audio (20 Hz-15 kHz) at 64 kbps
JPH04270397A (ja) 音声符号化方式
JPH04271400A (ja) 音声符号化方式

Legal Events

Date Code Title Description
NUG Patent has lapsed