SE519976C2 - Kodning och avkodning av signaler från flera kanaler - Google Patents

Kodning och avkodning av signaler från flera kanaler

Info

Publication number
SE519976C2
SE519976C2 SE0003284A SE0003284A SE519976C2 SE 519976 C2 SE519976 C2 SE 519976C2 SE 0003284 A SE0003284 A SE 0003284A SE 0003284 A SE0003284 A SE 0003284A SE 519976 C2 SE519976 C2 SE 519976C2
Authority
SE
Sweden
Prior art keywords
channels
individual
codebook
channel
common
Prior art date
Application number
SE0003284A
Other languages
English (en)
Other versions
SE0003284L (sv
SE0003284D0 (sv
Inventor
Tor Bjoern Minde
Arne Steinarson
Anders Uvliden
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20281031&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=SE519976(C2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE0003284A priority Critical patent/SE519976C2/sv
Publication of SE0003284D0 publication Critical patent/SE0003284D0/sv
Priority to CN01815496.4A priority patent/CN1216365C/zh
Priority to EP01961541A priority patent/EP1327240B1/en
Priority to ES01961541T priority patent/ES2291340T3/es
Priority to DE60131009T priority patent/DE60131009T2/de
Priority to US10/380,422 priority patent/US7346110B2/en
Priority to AT01961541T priority patent/ATE376239T1/de
Priority to AU2001282801A priority patent/AU2001282801B2/en
Priority to AU8280101A priority patent/AU8280101A/xx
Priority to PCT/SE2001/001828 priority patent/WO2002023527A1/en
Priority to JP2002527491A priority patent/JP4812230B2/ja
Publication of SE0003284L publication Critical patent/SE0003284L/sv
Publication of SE519976C2 publication Critical patent/SE519976C2/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Error Detection And Correction (AREA)
  • Analogue/Digital Conversion (AREA)

Description

lO 15 20 25 30 519 976 2 SAMMANFATTNING Ett syfte med den föreliggande uppfinningen är att bättre utnyttja korrela- tion mellan kanaler i kodning/ avkodning av signaler från flera kanaler ge- nom linjär prediktiv analys genom syntes och företrädesvis att underlätta anpassning av kodning/ avkodning till varierande korrelation mellan kanaler.
Detta syfte uppnås i enlighet med de bifogade patentkraven.
Kortfattat innefattar den föreliggande uppfinningen en flerdelad fast kodbok med en individuell fast kodbok för varje kanal samt en fast kodbok som är gemensam för alla kanaler. Denna strategi gör det möjligt att variera antalet bitar som allokeras till de individuella kodböckerna och den gemensamma kodboken antingen ram för ram, berorende på korrelationen mellan kanaler, eller samtal för samtal, berorende pä den önskade bruttobitraten. I ett fall där korrelationen mellan kanaler är hög krävs således väsentligen endast den gemensamma kodboken, medan i ett fall där korrelationen mellan ka- naler är låg krävs väsentligen endast de individuella kodböckerna. Om kor- relationen mellan kanaler är känd eller antas vara hög kan en fast kodbok som är gemensam för alla kanaler vara tillräcklig. Pä liknande sätt används väsentligen endast den gemensamma kodboken om den önskade bruttobit- raten är läg, medan i ett fall där den önskade bruttobitraten är hög kan de individuella kodböckerna användas.
KORT BESKRIVNING AV RITNINGARNA Uppfinningen, tillsammans med ytterligare syften och fördelar med denna, kan bäst förstås genom hänvisningar till följande beskrivning läst tillsammans med de medföljande ritningarna, i vilka: FIG. 1 är ett blockdiagram av en konventionell LPAS-talkodare för en kanal; FIG. 2 är ett blockdiagrain av en utföringsform av analysdelen av en LPAS-talkodare för flera kanaler enligt känd teknik; 10 15 20 25 30 ' 519 976 ëpggzjjf-hf 3 - 3 : :z FIG. 3 är ett blockdiagram av en utföringsform av syntesdelen av en LPAS-talkodare för flera kanaler enligt känd teknik; FIG. 4 är ett blockdiagram av en belysande utföringsform av syntesde- len av en LPAS-talkodare för flera kanaler i enlighet med den föreliggande uppfinningen; FIG. 5 är ett flödesdiagram av en belysande utföringsform av ett sökför- farande för en flerdelad fast kodbok i enlighet med den föreliggande uppfin- ningen; FIG. 6 är ett flödesdiagram av en annan belysande utföringsform av ett sökförfarande för en flerdelad fast kodbok i enlighet med den föreliggande uppfinningen; samt FIG. 7 är ett blockdiagram av en belysande utföringsform av analysde- len av en LPAS-talkodare för flera kanaler i enlighet med den föreliggande uppfinningen.
DETALJERAD BESKRIVNING AV FÖREDRAGNA UTFÖRINGSFORMER I den följande beskrivningen används samma hänvisningsbeteckningar för motsvarande eller liknande element.
Den föreliggande uppfinningen kommer nu att beskrivas genom introduktion av en konventionell talkodare för en kanal som utnyttjar linjär prediktiv ana- lys genom syntes (LPAS) och en allmän talkodare för flera kanaler som ut- nyttjar linjär prediktiv analys genom syntes (LPAS) som beskrivs i [3].
Fig. l är ett blockdiagram av en konventionell LPAS-talkodare för en kanal.
Kodaren innefattar två delar, nämligen en syntesdel och en analysdel (en mot- svarande avkodare innehåller endast en syntesdel).
Syntesdelen innefattar ett LPC-syntesñltret 12 som mottager en exciterings- signal i(n) och matar ut en syntestalsignal šlfl). Excitationssignalen i(n) bildas genom addering av två signaler u(n) och v(n) i en adderare 22. Signalen u(n) 10 15 20 25 30 ' 5 1 9 9 7 6 ' 4 bildas genom -skalning av en signal f(n) från en fast kodbok 16 med en för- stärkning gF i ett förstärkningselement 20. Signalen v(n) bildas genom skal- ning av en fördröjd (av fördröjning “lag”) version av excitationssignalen i(n) från en adaptiv kodbok 14 med en förstärkning gA i ett förstärkningselement 18. Den adaptiva kodboken bildas av en återkopplad loop som innefattar ett fördröjningselement 24 som fördröjer excitationssignalen i(n) en delrams längd N. Den adaptiva kodboken innehåller således föregående excitationer i(n) som skíftas in i kodboken (de äldsta excitationerna skiftas ut från kodboken och kastas). LPC-syntesfiltrets parametrar uppdateras typiskt var 20-40 ms ram medan den adaptiva kodboken uppdateras var 5-10 ms delram.
Analysdelen av LPAS-kodaren utför en LPC-analys av den inkommande talsig- nalen s(n) samt utför även en excitationsanalys.
LPC-analysen utförs av ett LPC-analysfilter 10. Detta filter mottager talsigna- len s(n) och bygger en parametermodell av denna signal på ett grundval av ram för ram. Modellparametrarna väljs för att minimera energin hos en rest- vektor som bildas av skillnaden mellan en aktuell talramsvektor och den mot- svarande signalvektorn som framställs av modellen. Modellparametrarna re- presenteras av analysfiltrets 10 filterkoefficienter. Dessa filterkoefficienter definierar filtrets överföringsfunktion A(z). Eftersom syntesfiltret 12 har en överföringsfunktion som är åtminstone ungefär lika med 1 /A(z) styr även des- sa filterkoefficienter syntesfiltret 12, vilket antyds av den streckade styrlinjen.
Excitationsanalysen utförs för bestämning av den bästa kombinationen av fast kodboksvektor (kodboksindex), förstärkning gp, adaptiv kodboksvektor (lag) samt förstärkning gA som resulterar i den syntessignalvektorn {š(f1)} som bäst stämmer överens med talsignalvektor {s(n)} (här betecknar { } en samling sam- pel som bildar en vektor eller ram). Detta utförs i en uttömmande sökning som testar alla möjliga kombinationer av dessa parametrar (suboptimala sökplaner är också möjliga, i vilka några parametrar bestäms oberoende av de andra parametrarna och därefter hålls fasta under sökningen efter de återstående parametrarna). För att testa hur nära en syntesvektor (šlnll äf den mOtSVa- 10 15 20 25 30 519 976 - *s rande talvektorn {s(n)} kan differensvektorns {e(n)} (som bildas i en adderare) energi beräknas i en energiberäknare 30. Det är emellertid effektivare att be- trakta energin hos en viktad felsignalvektor {ew(n)}, i vilken felen har omförde- lats på ett sådant sätt att stora fel maskas av frekvensband med stor ampli- tud. Detta utförs i viktningsfilter 28.
Modifieringen av LPAS-kodaren för en kanal i fig. 1 till en LPAS-kodare för flera kanaler i enlighet med [3] kommer nu att beskrivas med hänvisning till fig. 2-3. En talsignal från två kanaler (stereo) antas men samma principer kan användas för fler än två kanaler.
Fig. 2 är ett blockdiagram av en utföringsform av analysdelen av en LPAS- talkodare för flera kanaler som beskrivs i [3]. I fig. 2 är nu insignalen en signal från flera kanaler vilket antyds av signalkomponenter s1(n), s2(n). LPC- analysfiltret 10 i fig. 1 har ersatts med ett LPC-analysfilterblock lOM som har en matrisvärd överföringsfunktion A(z). På liknande sätt ersätts adderaren 26, viktningsfilteret 28 samt energiberälmaren 30 av motsvarande block för flera kanaler 26M, 28M respektive 30M.
Fig. 3 är ett blockdiagram av en utföringsform av syntesdelen av en LPAS- talkodare för flera kanaler som beskrivs i [3]. En avkodare för flera kanaler kan även bildas av en sådan syntesdel. Här har LPC-syntesfiltret 12 i fig. 1 ersatts av ett LPC-syntesfilterblock l2M som har en matrisvärd överförings- funktion A'1(z) som är (vilket antyds av beteckningen) åtminstone ungefär lika med inversen av A(z). På liknande sätt ersätts adderaren 22, den fasta kodbo- ken 16, förstärkningselementet 20, fördröjningselementet 24, den adaptiva kodboken 14 samt förstärkningselementet 18 av motsvarande block för flera kanaler 22M, l6M, 24M, 14M respektive l8M.
Ett problem med denna kodare för flera kanaler enligt känd teknik är att den inte är särskilt anpassbar med avseende på varierande korrelation mellan kanaler som beror på varierande mikrofonmiljöer. Till exempel kan flera mik- rofoner i vissa situationer plocka upp tal från en enda talare. I ett sådant fall 10 15 20 25 30 519 976 - 6 är signalerna från de olika mikrofonerna väsentligen fördröjda och skalade versioner (om ekon kan antas vara försumbara) av samma signal, dvs. kana- lerna är starkt korrelerade. I andra situationer kan det finnas flera talare samtidigt vid de individuella mikrofonerna. I detta fall finns det nästan ingen korrelation mellan kanaler.
Fig. 4 är ett blockdiagram av en belysande utföringsform av syntesdelen av en LPAS-talkodare för flera kanaler i enlighet med den föreliggande uppfinningen.
Ett väsentligt särdrag av den föreliggande uppfinningen är strukturen hos den flerdelade fasta kodboken. Enligt uppfinningen innefattar den både individu- ella fasta kodböcker FC1, FC2 för varje kanal och en gemensam fast kodbok FCS. Fastän den gemensamma fasta kodboken FCS är gemensam för alla kanaler (vilket betyder att samma kodboksindex används av alla kanaler) associeras kanalerna med individuella fördröjningar Dl, D2, vilket illustreras i fig. 4. De individuella fasta kodböckerna FCl, FC2 associeras vidare med indi- viduella förstärkningar gFl, gm, medan de individuella fördröjningarna Dl, D2 (som antingen kan vara heltal eller bråkdelar) associeras med individuella förstärkningar gFsl, gps? Excitatíonen från varje individuell fast kodbok FSI, F82 adderas till den motsvarande excitationen (en gemensam kodboksvektor men individuella fördröjningar och förstärkningar för varje kanal) från den gemensamma fasta kodboken FCS i en adderare AFl, AF2. De fasta kodböck- erna innefattar typiskt algebraiska kodböcker, i vilka excitationsvektorerna bildas av enhetspulser som fördelas över varje vektor i enlighet med vissa regler (detta är välkänt för fackmannen och kommer inte att beskrivas ytterli- gare) .
Denna struktur av den flerdelade fasta kodboken är mycket anpassningsbar.
Till exempel kan några kodare använda fler bitar i de individuella fasta kod- böckerna medan andra kodare kan använda fler bitar i den gemensamma fasta kodboken. Dessutom kan en kodare dynamiskt ändra fördelningen av bitar mellan individuella och gemensamma kodböcker beroende pä korrelatio- nen mellan kanaler. För vissa signaler kan det till och med vara lämpligt att 10 15 20 25 30 519 976 ß» I = | r V i - » . ~ « , x , , '7 - I f ».. ..- allokera fler bitar till en individuell kanal än till de andra kanalerna (asymmet- risk fördelning av bitar).
Fastän fig. 4 illustrerar en fast kodboksstruktur för två kanaler inses att kon- cepten lätt generaliseras till fler kanaler genom ökning av antalet individuella kodböcker och antalet fördröjningar och förstärkningar mellan kanaler.
De gemensamma och individuella kodböckerna genomsöks typiskt seriellt.
Den föredragna ordningen är att först bestämma den gemensamma fasta kod- bokens excitationsvektor, fördröjningar och förstärkningar. Därefter bestäms de individuella fasta kodböckernas vektorer och förstärkningar.
Två sökförfaranden för en flerdelad fast kodbok kommer nu att beskrivas med hänvisning till fig. 5 och 6.
Fig. 5 är ett flödesdiagram av en belysande utföringsform av ett sökförfarande för en flerdelad fast kodbok i enlighet med den föreliggande uppfinningen. Steg Sl bestämmer en primär eller ledande kanal, typiskt den starkaste kanalen (kanalen som har den största ramenergin). Steg S2 bestämmer korskorrelatio- nen mellan varje sekundär eller efterföljande kanal och den primära kanalen för ett förbestämt intervall, till exempel en del av eller en fullständig ram. Steg S3 lagrar fördröjningskandidater för varje sekundär kanal. Dessa fördröj- ningskandidater definieras av positionerna hos ett antal av de högsta korskor- relationstopparna och de närmaste positionerna runt varje topp för varje se- kundär kanal. Man skulle till exempel kunna välja de 3 högsta topparna och därefter addera de närmsta positionerna på båda sidorna om varje topp vilket ger totalt 9 fördröjningskandidater. Om fördröjningar med hög (bråkdel) upp- lösning används kan antalet kandidater runt varje topp ökas till exempelvis 5 eller 7. Den högre upplösningen kan erhållas genom uppsampling av insigna- len. Fördröjningen för den primära kanalen kan i en enkel utföringsform an- ses vara noll. Eftersom pulserna i kodboken typiskt inte kan ha godtyckliga positioner kan emellertid en viss kodningsvinst erhållas genom tilldelning av en fördröjning även till den primära kanalen. Detta är särskilt fallet när för- lO 15 20 25 30 519 _9768 dröjningar med hög upplösning används. I steg S4 bildas en temporär gemen- sam fast kodboksvektor för varje lagrad kombination av fördröjningskandida- ter. Steg S5 väljer den fördröjningskombinationen som motsvarar den bästa temporära kodboksvektorn. Steg S6 bestämmer de optimala förstärkningarna mellan kanaler. Slutligen bestämmer steg S7 de kanalspecifika (icke- gemensamma) excitationerna och förstärkningarna.
I en variant av denna algoritm bibehålls alla eller de bästa temporära kod- boksvektorerna samt motsvarande fördröjningar och förstärkningar mellan kanaler. För varje bibehållen kombination utförs en kanalspecifik sökning i enlighet med steg S7. Slutligen väljs den bästa kombinationen av gemensam och individuell fast kodboksexcitation.
För att reducera detta förfarandes komplexitet är det möjligt att begränsa den temporära kodbokens excitationsvektor till endast några pulser. Till exempel, i GSM-systemet innefattar den fullständiga fasta kodboken hos en förbättrad (eng. ”enhanced”) kanal med full hastighet 10 pulser; I detta fall är 3-5 tempo- rära kodbokspulser rimligt. I allmänhet skulle 25-50% av det totala antalet pulser vara ett rimligt antal. När den bästa fördröjningskombinationen har valts söks den fullständiga kodboken endast efter denna kombination (typiskt är de redan placerade pulserna oförändrade, endast de återstående pulserna i en fullständig kodbok måste placeras).
Fig. 6 är ett flödesdiagram av en annan utföringsform av ett sökförfarande för en flerdelad fast kodbok i enlighet med den föreliggande uppfinningen. I denna utföringsform är stegen S1, S6 och S7 samma som i utföringsformen i fig. 5.
Steg S10 placerar en ny excitationsvektorpuls i en optimal position för varje tillåten fördröjningskombination (den första gången detta steg utförs är alla fördröjningskombinationer tillåtna). Steg S11 testar huruvida alla pulser har förbrukats. Om inte begränsar steg S12 de tillåtna fördröjningskombinatio- nerna till de bästa återstående kombinationerna. Därefter adderas ytterligare en puls till de återstående tillåtna kombinationerna. Slutligen när alla pulser 10 15 20 25 30 ' 519 976 ' 9 har förbrukats väljer steg S13 den bästa återstående fördröjningskombinatio- nen och dess motsvarande gemensamma fasta kodboksvektor.
Det finns flera möjligheter med avseende på steget S12. En möjlighet är att endast bibehålla en viss procent, till exempel 25%, av de bästa fördröjnings- kombinationerna i varje iteration. För att undvika att det endast återstår en kombination innan alla pulser har förbrukats är det emellertid möjligt att säkerställa att åtminstone ett visst antal kombinationer återstår efter varje iteration. En möjlighet är att säkerställa att det alltid återstår åtminstone så många kombinationer som det finns pulser kvar plus ett. På detta sätt kom- mer det alltid finnas flera kandidatkombinationer att välja från i varje itera- tion.
För de fasta kodboksförstärkningarna kräver varje kanal en förstärkning för den gemensamma fasta kodboken och en förstärkning för den individuella kodboken. Dessa förstärkningar har typiskt betydande korrelation mellan kanalerna. De korreleras även till förstärkningar i den adaptiva kodboken.
Interkanalprediktioner av dessa förstärkningar kommer således vara möjliga och vektorkvantisering kan användas för att koda dem.
Enligt fig. 4 innefattar den adaptiva kodboken en adaptiv kodbok ACl, AC2 för varje kanal. En adaptiv kodbok kan konñgureras på ett antal sätt i en kodare för flera kanaler.
En möjlighet är att låta alla kanaler dela en gemensam delningsfördröjning (eng. ”pitch lag”). Detta är lämpligt om det finns en stark korrelation mellan kanaler. Även när delningsfördröjningen är gemensam kan kanalerna fortfa- rande ha separata delningsförstärkningar (eng. ”pitch gains”) gAll-gAgz. Den gemensamma delningsförstärkningen söks simultant i alla kanaler på ett sätt som liknar en sluten loop.
En annan möjlighet är att låta varje kanal har en individuell delningsfördröj- ning. Detta är lärnpligt när det finns en svag korrelation mellan kanaler (ka- lO 15 20 30 519 9761 .. . a .. n - n i. i - . . ~ n - i - . _ _ g - . _ - . , . . . » I . i . . . . - i »- . - ß O I I - u nu - . ø » » = » . | | u n nalerna är oberoende). Delningsfördröjningarna kan kodas differentiellt eller absolut.
En ytterligare möjlighet är att använda kunskap om tidigare excitationer på ett korskanalssätt. Till exempel kan kanal 2 förutsägas från kunskapen om tidi- gare excitationer hos kanal 1 vid fördröjningen P12 mellan kanaler. Detta är lärnpligt när det finns en stark korrelation mellan kanaler.
Som fallet med den fasta kodboken är den beskrivna adaptiva kodboksstruk- turen mycket anpassbar och lämplig för multimodsdrift. Valet att använda gemensamma eller individuella delningsfördröjningar kan baseras på restsig- nalenergin. I ett första steg bestäms den optimala gemensamma delningsför- dröjningens restenergi. I ett andra steg bestäms de optimala individuella del- ningsfördröjningarnas restenergi. Om restenergin i fallet med gemensam del- ningsfördröjning överskrider restenergin i fallet med individuella delningsför- dröjningar med ett förbestämt belopp används individuella delningsfördröj- ningar. Annars används en gemensam delningsfördröjning. Om så önskas kan ett rörligt medelvärde av energiskillnaden användas för att göra beslutet mju- kare.
Denna strategi kan anses vara en “sluten loop”-strategi för att besluta mellan gemensamma eller individuella delningsfördröjningar. En annan möjlighet är en “öppen loop”-strategi som baseras på, till exempel, korrelation mellan ka- naler. I detta fall används en gemensam delningsfördröjning om korrelationen mellan kanaler överskrider en förbestämd tröskel. Annars används individu- ella delningsfördröjningar.
Liknande strategier kan användas för att bestälnma huruvida delningsför- dröjningar mellan kanaler ska användas.
Vidare förväntas en betydande korrelation mellan de olika kanalernas adapti- va kodboksförstärkningar. Dessa förstärkningar kan förutsägas från kunskap om kanalens tidigare förstärkningar, från förstärkningar i samma ram men 10 15 20 25 30 519 976 .. ß . . . . . , ' ' l l .i _ ~_ -~ ~ _ a . , .', f ', , l ' i . . . f Å. J. 2.. 2, .,' , som tillhör andra kanaler samt även från fasta kodboksförstärkningar. Som i fallet med den fasta kodboken är även vektorkvantisering möjligt.
I LPC-syntesfilterblocket l2M i fig. 4 använder varje kanal ett individuellt LPC- filter (linjär prediktiv kodning). Dessa filter kan härledas oberoende av var- andra på samma sätt som fallet med en enstaka kanal. Vissa eller alla kana- lerna kan emellertid även dela samma LPC-filter. Detta tillåter omkoppling mellan multipel- eller singelfilterrnoder beroende på signalegenskaper, t.ex. spektralavständ mellan LPC-spektra.
Fig. 7 är ett blockdiagrarn av en belysande utföringsform av analysdelen av en LPAS-talkodare för flera kanaler i enlighet med den föreliggande uppfinningen.
Förutom blocken som redan har beskrivits med hänvisning till fig. 1 och 2 innefattar analysdelen i lig. 7 ett multimodsanalysblock 40. Blocket 40 be- stämmer korrelationen mellan kanaler för att bestämma huruvida det finns tillräcklig korrelation mellan kanalerna för att motivera kodning genom an- vändning av endast den gemensamma fasta kodboken FCS, fördröjningarna Dl, D2 samt förstärkningarna gFsl, gFSQ. Om inte är det nödvändigt att använ- da de individuella fasta kodböckerna FCl, FC2 samt förstärkningarna gm, gm.
Korrelationen kan bestämmas av den vanliga korrelationen i tidsdomänen, dvs. genom skiftning av de sekundära kanalsignalerna med avseende på den primära signalen tills en bästa passning erhålls. Om det finns fler än två ka- naler används en gemensam fast kodbok om det minsta korrelationsvärdet överskrider en förbestämd tröskel. En annan möjlighet är att använda en gemensam fast kodbok för kanalerna som har en korrelation till den primära kanalen som överskrider en förbestämd tröskel och individuella fasta kod- böcker för de återstående kanalerna. Den exakta tröskeln kan bestämmas genom lyssnartester.
I en kodare med låg bitrat kan den fasta kodboken innefatta endast en gemensam kodbok FCS och de motsvarande fördröjningselementen D1, D2 samt förstärkningarna mellan kanaler gFsl, gFSQ. Denna utföríngsform motsva- rar en korrelationströskel mellan kanaler som är lika med noll. lO 15 20 25 30 519 976 ' 1' 1. 1 n ~ . - _, . . I - . ~ . . . . . , . , , 2 | - - .. .m w-»nø Analysdelen kan även innefatta en beräknare 42 av relativ energi som be- stämmer skalfaktorer ei, e2 för varje kanal. Dessa skalfaktorer kan bestärn- mas i enlighet med: E e.: i där Ef är energin hos ram i. Genom användning av dessa skalfaktorer kan de viktade restenergierna Rx, Rz för varje kanal omskalas i enlighet med kanalens relativa styrka, vilket antyds i ñg. 7. Omskalning av restenergin för varje kanal har effekten att optimera för det relativa felet i varje kanal snarare än att op- timera för det absoluta felet i varje kanal. Felomskalning i fallet med flera kanaler kan användas i alla steg (härledning av LPG-filtret, adaptiva och fasta kodböcker).
Skalfaktorerna kan även vara generellare funktioner av den relativa kanal- styrkan ei, till exempel: expwe. -1>) 1+ exp(a(2e, - 1)) f (å) = där or är en konstant i intervallet 4-7, till exempel otzö. Skalningsfunktionens exakta form kan bestämmas av subjektiva lyssnartester.
De olika elementens funktion hos den föreliggande uppfinningens beskrivna utföringsformer implementeras typiskt av en eller flera mikroprocessorer eller mikro- / signalprocessorkombinationer och motsvarande mjukvara.
Beskrivningen ovan har huvudsakligen riktats mot en kodare. Den motsva- rande avkodaren skulle endast innefatta syntesdelen av en sådan kodare.
Typiskt används en kombination av kodare / avkodare i en terminal som sän- der/ mottager kodade signaler över en kommunikationskanal med begränsad 519 976 ' ;_j;e"-=' . . i. . . . . - » - . . _ . -. . n . . , . , . . _ » . . . . [3 v I - _ H h» w-:n- bandbredd. Terminalen kan vara en radiokanal i en cellulär telefon eller bas- station. En sådan terminal skulle även innefatta olika andra element såsom en antenn, förstärkare, utjämnare, kanalkodare/-avkodare, etc. Dessa ele- ment är emellertid inte nödvändiga för beskrivning av den föreliggande upp- 5 ñnningen och har därför utelämnats.
Det kommer att inses av fackmannen att olika modifikationer och ändringar kan göras av den föreliggande uppfinningen utan att avvika från dess omfatt- ning, som definieras av de bifogade patentkraven. 10 REFERENSER [1] A. Gersho, "Advances in Speech and Audio Compression", Proc. of the IEEE, Vol. 82, Nr. 6, sidorna 900-918, Juni 1994, 15 [2] A. S. Spanias, "Speech Coding: A Tutorial Review", Proc. of the IEEE, Vol 82, Nr. lO, sidorna 1541-1582, Okt. 1994. [3] WO 00/ 19413 (Telefonaktiebolaget LM Ericsson). 2 0

Claims (18)

lO 15 20 25 30 519 976m PATENTKRAV
1. l. Kodare för linjär prediktiv analys genom syntes av signaler från flera kana- ler som innefattar en flerdelad fast kodbok, kännetecknad av: en individuell fast kodbok (FCI, FCQ) för varje kanal; en gemensam fast kodbok (FCS) innehållande gemensamma kodbok- vektorer för alla kanaler; och organ (40) för analysering av korrelationen mellan kanaler för dynamisk bitallokering mellan de individuella fasta kodböckerna och den gemensamma fasta kodboken.
2. Kodare enligt patentkrav 1, kännetecknad av att den gemensamma fasta kodboken är kopplad till ett individuellt fördröjningselement (Dl, D2) för varje kanal.
3. Kodare enligt patentkrav 2, kännetecknad av att de individuella fördröj- ningselementen (Dl, D2) är element med hög upplösning.
4. Kodare enligt patentkrav 2 eller 3, kännetecknad av att varje fördröjnings- element (Dl, D2) är kopplat till ett motsvarande förstärkningselement (gFsl, gifsz) -
5. Kodare enligt patentkrav 1, kännetecknar! av en flerdelad adaptiv kodbok som har en individuell adaptiv kodbok (AC1, AC2) och en individuell del- ningsfördröjning (P11, P22) för varje kanal.
6. Kodare enligt patentkrav 5, kännetecknad av organ för bestämning huru- vida en gemensam delningsfördröjning kan användas av alla kanaler.
7. Kodare enligt patentkrav 5, kännetecknad av interkanaldelningsfördröj- ningar (P12, P21) mellan varje kanal och de andra kanalerna. 10 15 20 25 30 519 976 /5
8. Kodare enligt patentkrav 1, kännetecknad av organ (42) för omskalning av varje kanals restenergi i enlighet med den relativa kanalstyrkan.
9. Tenninal som innefattar en talkodare för linjär prediktiv analys genom syntes av signaler från flera kanaler och innehållande en flerdelad fast kod- bok, kännetecknad av: en individuell fast kodbok (FCl, FC2) för varje kanal; en gemensam fast kodbok (FCS) innehållande gemensamma kodbok- vektorer för alla kanaler; och organ (40) för analysering av korrelationen mellan kanaler för dynamisk bitallokering mellan de individuella fasta kodböckerna och den gemensamma fasta kodboken.
10. Terminal enligt patentkrav 9, kännetecknad av att den gemensamma fasta kodboken är kopplad till ett individuellt fördröjningselement (Dl, D2) för varje kanal.
11. Terminal enligt patentkrav 10, kännetecknad av att de individuella för- dröjningselementen (Dl, D2) är element med hög upplösning.
12. Terminal enligt patentkrav 10 eller 11, kännetecknad av att varje fördröj- ningselement (D1, D2) är kopplat till ett motsvarande förstärkningselement (grsi > ššrszl-
13. Terminal enligt patentkrav 9, kännetecknad av en flerdelad adaptiv kod- bok som har en individuell adaptiv kodbok (AC1, AC2) och en individuell del- ningsfördröjning (P11, P22) för varje kanal.
14. Terminal enligt patentkrav 13, kännetecknad av organ för bestämning huruvida en gemensam delningsfördröjning kan användas av alla kanaler.
15. Terminal enligt patentkrav 13, kännetecknad av interkanaldelningsför- dröjningar (P12, P21) mellan varje kanal och de andra kanalerna. 10 15 20 25 519 976 _ lb'
16. Terminal enligt något av de föregående patentkraven 18-26, känneteck- nad av att terminalen är en radioterminal.
17. Kodningsförfarande för linjär prediktiv analys genom syntes av signaler från flera kanaler, kännetecknat av: analysering av korrelation mellan kanaler; samt dynamisk ändring, beroende på den nuvarande korrelationen mellan kanaler, av kodningsbitallokeringen mellan fasta kodböcker som dediceras till individuella kanaler och en gemensam fast kodbok innehållande gemensam- ma kodbokvektorer för alla kanaler.
18. Kodningsförfarande för linjär prediktiv analys genom syntes av signaler från flera kanaler, kännetecknat av: bestämning av en önskad bruttobitrat; analysering av korrelation mellan kanaler; samt anpassning, beroende på den bestämda bruttobitraten och nämnda önskade bruttobitrat, av kodningsbitallokeringen mellan fasta kodböcker som dediceras till individuella kanaler och en gemensam fast kodbok inne- hållande gemensamma kodbokvektorer för alla kanaler.
SE0003284A 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler SE519976C2 (sv)

Priority Applications (11)

Application Number Priority Date Filing Date Title
SE0003284A SE519976C2 (sv) 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler
JP2002527491A JP4812230B2 (ja) 2000-09-15 2001-08-29 複数チャネル信号の符号化及び復号化
PCT/SE2001/001828 WO2002023527A1 (en) 2000-09-15 2001-08-29 Multi-channel signal encoding and decoding
CN01815496.4A CN1216365C (zh) 2000-09-15 2001-08-29 多信道语音信号编码和解码
EP01961541A EP1327240B1 (en) 2000-09-15 2001-08-29 Multi-channel signal coding
ES01961541T ES2291340T3 (es) 2000-09-15 2001-08-29 Codificacion de señalmulti-canal.
DE60131009T DE60131009T2 (de) 2000-09-15 2001-08-29 Mehrkanal-signalcodierung
US10/380,422 US7346110B2 (en) 2000-09-15 2001-08-29 Multi-channel signal encoding and decoding
AT01961541T ATE376239T1 (de) 2000-09-15 2001-08-29 Mehrkanal-signalcodierung
AU2001282801A AU2001282801B2 (en) 2000-09-15 2001-08-29 Multi-channel signal encoding and decoding
AU8280101A AU8280101A (en) 2000-09-15 2001-08-29 Multi-channel signal encoding and decoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0003284A SE519976C2 (sv) 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler

Publications (3)

Publication Number Publication Date
SE0003284D0 SE0003284D0 (sv) 2000-09-15
SE0003284L SE0003284L (sv) 2002-03-16
SE519976C2 true SE519976C2 (sv) 2003-05-06

Family

ID=20281031

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0003284A SE519976C2 (sv) 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler

Country Status (10)

Country Link
US (1) US7346110B2 (sv)
EP (1) EP1327240B1 (sv)
JP (1) JP4812230B2 (sv)
CN (1) CN1216365C (sv)
AT (1) ATE376239T1 (sv)
AU (2) AU8280101A (sv)
DE (1) DE60131009T2 (sv)
ES (1) ES2291340T3 (sv)
SE (1) SE519976C2 (sv)
WO (1) WO2002023527A1 (sv)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2368761B (en) * 2000-10-30 2003-07-16 Motorola Inc Speech codec and methods for generating a vector codebook and encoding/decoding speech signals
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
BRPI0516201A (pt) * 2004-09-28 2008-08-26 Matsushita Electric Ind Co Ltd aparelho de codificação escalonável e método de codificação escalonável
JP4887282B2 (ja) * 2005-02-10 2012-02-29 パナソニック株式会社 音声符号化におけるパルス割当方法
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
CN101147191B (zh) * 2005-03-25 2011-07-13 松下电器产业株式会社 语音编码装置和语音编码方法
EP1887567B1 (en) * 2005-05-31 2010-07-14 Panasonic Corporation Scalable encoding device, and scalable encoding method
KR101398836B1 (ko) * 2007-08-02 2014-05-26 삼성전자주식회사 스피치 코덱들의 고정 코드북들을 공통 모듈로 구현하는방법 및 장치
WO2010091736A1 (en) * 2009-02-13 2010-08-19 Nokia Corporation Ambience coding and decoding for audio applications
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
US9978379B2 (en) * 2011-01-05 2018-05-22 Nokia Technologies Oy Multi-channel encoding and/or decoding using non-negative tensor factorization
US9449607B2 (en) * 2012-01-06 2016-09-20 Qualcomm Incorporated Systems and methods for detecting overflow
PL3011554T3 (pl) * 2013-06-21 2019-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Szacowanie opóźnienia wysokości tonu
CN110931025A (zh) * 2013-06-21 2020-03-27 弗朗霍夫应用科学研究促进协会 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
MY188370A (en) * 2015-09-25 2021-12-06 Voiceage Corp Method and system for decoding left and right channels of a stereo sound signal
US20210027794A1 (en) * 2015-09-25 2021-01-28 Voiceage Corporation Method and system for decoding left and right channels of a stereo sound signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3435674B2 (ja) * 1994-05-06 2003-08-11 日本電信電話株式会社 信号の符号化方法と復号方法及びそれを使った符号器及び復号器
US5651090A (en) 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US6081781A (en) * 1996-09-11 2000-06-27 Nippon Telegragh And Telephone Corporation Method and apparatus for speech synthesis and program recorded medium
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
WO1999016036A1 (en) * 1997-09-24 1999-04-01 Eldridge Martin E Position-responsive, hierarchically-selectable information presentation system and control program
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler

Also Published As

Publication number Publication date
AU2001282801B2 (en) 2007-06-07
SE0003284L (sv) 2002-03-16
EP1327240B1 (en) 2007-10-17
DE60131009T2 (de) 2008-07-17
WO2002023527A1 (en) 2002-03-21
ES2291340T3 (es) 2008-03-01
CN1216365C (zh) 2005-08-24
JP4812230B2 (ja) 2011-11-09
ATE376239T1 (de) 2007-11-15
AU8280101A (en) 2002-03-26
JP2004509365A (ja) 2004-03-25
US20040044524A1 (en) 2004-03-04
EP1327240A1 (en) 2003-07-16
CN1455917A (zh) 2003-11-12
SE0003284D0 (sv) 2000-09-15
US7346110B2 (en) 2008-03-18
DE60131009D1 (de) 2007-11-29

Similar Documents

Publication Publication Date Title
SE519976C2 (sv) Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) Kodning och avkodning av signaler från flera kanaler
SE519985C2 (sv) Kodning och avkodning av signaler från flera kanaler
CN1926608B (zh) 多声道信号处理设备和方法
CA2524243C (en) Speech coding apparatus including enhancement layer performing long term prediction
CA2344523C (en) Multi-channel signal encoding and decoding
TWI453734B (zh) 用以將符號編碼之方法、用以將符號解碼之方法、用以將符號從發送器發送至接收器之方法、編碼器、解碼器、及用以將符號從發送器發送至接收器之系統
AU2001282801A1 (en) Multi-channel signal encoding and decoding
WO2006059567A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
CN1125438C (zh) 降低编码的语音信号中的稀疏
EP1852850A1 (en) Scalable encoding device and scalable encoding method
EP3550563A1 (en) Encoder, decoder, encoding method, decoding method, and program
CN110050304A (zh) 用于处理包络表示系数的方法、编码器和解码器
KR100329875B1 (ko) 신호샘플들을연속적으로전송하는전송시스템,이시스템에사용되는전송기,수신기,코더,디코더,및신호샘플을재구성하는보간수단,신호샘플에용장성을부가하는방법,및신호샘플을재구성하는방법
US8655650B2 (en) Multiple stream decoder
NL2002038C (en) Method and system for coding and decoding signals.
KR20220018557A (ko) 스테레오 코딩 방법 및 디바이스, 및 스테레오 디코딩 방법 및 디바이스
CN103119650B (zh) 编码装置和编码方法
Joshi et al. A Simulation-Based Comparison on Code Excited Linear Prediction (CELP) Coder at Different Bit Rates
EP1334485B1 (en) Speech codec and method for generating a vector codebook and encoding/decoding speech signals
CN117083881A (zh) 分离空间音频对象
JPH04333900A (ja) 音声符号化装置
WO1995029480A2 (en) Analogue signal coder

Legal Events

Date Code Title Description
NUG Patent has lapsed