SE521129C2 - Sätt och anordning för audiokodning - Google Patents

Sätt och anordning för audiokodning

Info

Publication number
SE521129C2
SE521129C2 SE9800776A SE9800776A SE521129C2 SE 521129 C2 SE521129 C2 SE 521129C2 SE 9800776 A SE9800776 A SE 9800776A SE 9800776 A SE9800776 A SE 9800776A SE 521129 C2 SE521129 C2 SE 521129C2
Authority
SE
Sweden
Prior art keywords
audio signal
quantized
generate
frequency
predicted
Prior art date
Application number
SE9800776A
Other languages
English (en)
Other versions
SE9800776D0 (sv
SE9800776L (sv
Inventor
Lin Yin
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of SE9800776D0 publication Critical patent/SE9800776D0/sv
Publication of SE9800776L publication Critical patent/SE9800776L/sv
Publication of SE521129C2 publication Critical patent/SE521129C2/sv

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)

Description

- . . » « a 521 129 2 tillgång till stora mängder minne för lagring av de beräknade koefficienterna och mellankoefficienter. Det är välkänt att då bakåtriktade adaptiva prediktorer av denna typ används i frek- vensdomänen är det svårt att ytterligare minska beräknings- belastningarna och minneskraven. Anledningen till detta är att antalet prediktorer är så stort i frekvensdomänen att till och med en mycket enkel adaptiv algoritm ändå ger stor beräknings- komplexitet och minneskrav. Även om det är känt att undvika detta problem genom att utnyttja framåtriktade adaptiva predik- torer som uppdateras i kodaren och överförs till avkodaren, resulterar ändå användningen av framåtriktade adaptiva predik- torer i frekvensdomänen oundvikligen i en stor mängd "sido"- information eftersom antalet prediktorer är så stort.
Ett ändamål med föreliggande uppfinning är att undvika eller åtminstone minska nackdelarna hos kända predikteringssätt.
Detta och andra ändamål uppnås genom kodning av en audiosignal med användande av felsignaler för att avlägsna redundans i vart och ett av ett flertal frekvensdelband hos audiosignalen och dessutom generera långsiktiga predikteringskoefficienter i tidsdomänen som möjliggör prediktering av en aktuell ram hos audiosignalen utifrån en eller fler tidigare ramar.
Enligt en första aspekt av föreliggande uppfinning åstadkommes ett sätt att koda en audiosignal, vilket sätt innefattar följande steg: att man mottar en audiosignal x som skall kodas; att man genererar en kvantiserad audiosignal 2 från den mottagna audiosignalen x; att man genererar en uppsättning långsiktiga predikte- ringskoefficienter A som kan användas för att prediktera en aktuell tidsram hos den mottagna audiosignalen direkt från åtminstone en föregående tidsram hos den kvantiserade audio- signalen X; man använder predikteringskoeff*cienterna A för att generera en predikterad audiosignal 2; att man jämför den mottagna audiosignalen x med den predikterade audiosignalen 2 och genererar en felsignal E(k) ~ , 1 . = . . « - ; I v 521 129 3 för vart och ett av ett flertal frekvensdelband; att man kvantiserar felsignalerna E(k) för att generera en uppsättning kvantiserade felsignaler É(k); och att man kombinerar de kvantiserade felsignalerna É(k) och predikteringskoefficienterna A för att generera en kodad audiosignal.
Föreliggande uppfinning ger komprimering av en audiosignal med användande av en framåtriktad adaptiv prediktor i tidsdomänen.
För varje tidsram hos en mottagen signal är det bara nödvändigt att generera och sända en enda uppsättning framåtriktade adap- tiva predikteringskoefficienter för överföring till avkodaren.
Detta skiljer sig från kända framåtriktade adaptiva predikte- ringstekniker som kräver generering av en uppsättning predikte- ringskoefficienter för varje frekvensdelband hos varje tidsram.
Jämfört med de predikteringsförbättringar som erhålles med föreliggande uppfinning är sidoinformationen hos den långsikti- ga prediktorn försumbar.
Vissa utföringsformer av föreliggande uppfinning möjliggör en minskning av beräkningskomplexiteten och minneskraven. Jämfört med användningen av bakåtriktad adaptiv prediktering föreligger särskilt inget krav att på nytt beräkna predikteringskoeffi- cienterna i avkodaren. Vissa utföringsformer av uppfinningen kan också reagera snabbare på signaländringar än konventio- nella, bakåtriktade adaptiva prediktorer.
Vid en utföringsform av uppfinningen transformeras den mottagna audiosignalen x i ramar xm från tidsdomänen till frekvensdomä- nen för att ge en uppsättning frekvensdelbandsignaler X(k). Den predikterade audiosignalen 2 transformeras på liknande sätt från tidsdomänen till frekvensdomänen för att generera en upp- sättning predikterade frekvensdelbandsignaler X(k) och jäm- förelsen mellan den mottagna audiosignalen x och den predikte- rade audiosignalen 2 utförs i frekvensdomänen, varvid respek- tive delbandsignaler jämförs med varandra för att generera frekvensdelbandfelsignaler E(k). Den kvantiserade audiosignalen 2 genereras genom summering av den predikterade signalen och . , . . x n 521 129 4 den kvantiserade felsignalen, antingen i tidsdomänen eller i frekvensdomänen.
Vid en alternativ utföringsform av uppfinningen utförs jäm- förelsen mellan den mottagna audiosignalen x och den predikte- rade audiosignalen 2 i tidsdomänen för att generera en fel- signal e som också ligger i tidsdomänen. Denna felsignal e omvandlas därefter från tid- till frekvensdomänen för att generera nämnda flertal frekvensdelbandfelsignaler E(k).
Företrädesvis utförs kvantiseringen av felsignalerna enligt en psyko-akustisk modell.
Enligt en andra aspekt av föreliggande uppfinning åstadkommes ett sätt att avkoda en kodad audiosignal, vilket sätt inne- fattar följande steg: att man mottar en kodad audiosignal innefattande en kvantiserad felsignal É(k) för vart och ett av ett flertal frekvensdelband hos audiosignalen och, för varje tidsram av audiosignalen, en uppsättning predikteringskoefficienter A som kan användas för att prediktera en aktuell tidram xp hos den mottagna audiosignalen direkt från åtminstone en föregående tidram hos en rekonstruerad, kvantiserad audiosignal X; att man genererar nämnda rekonstruerade, kvantiserade audiosignal 2 utifrån de kvantiserade felsignalerna É(k); att man använder predikteringskoefficienterna A och den kvantiserade audiosignalen 2 för att generera en predikterad audiosignal 2; att man transformerar den predikterade audiosignalen 2 från tiddomänen till frekvensdomänen för att generera en upp- sättning predikterade frekvensdelbandsignaler X(k) för kombi- nering med de kvantiserade felsignalerna É(k) för att generera en uppsättning rekonstruerade frekvensdelbandsignaler X(k); och att man utför en frekvens- till tiddomäntransform på de rekonstruerade frekvensdelbandsignalerna X(k) för att generera den rekonstruerade, kvantiserade audiosignalen X. . . . = 4 . : . - , . 1 521 129 Utföringsformer av ovannämnda andra aspekt av uppfinningen kan särskilt tillämpas då endast en delmängd av samtliga möjliga kvantiserade felsignaler É(k) mottages, varvid visst delband- data överförs direkt genom överföringen av audiodelbandsignaler X(k). Signalerna X(k) och X(k) kombineras på lämpligt sätt innan frekvens- till tidtransformen utförs.
Enligt en tredje aspekt av föreliggande uppfinning åstadkommes en anordning för kodning av en audiosignal, vilken anordning innefattar: en ingång för mottagning av en audiosignal x som skall kodas; ett behandlingsorgan kopplat till nämnda ingång för generering utifrån den mottagna audiosignalen x av en kvanti- serad audiosignal X; ett predikteringsorgan kopplat till nämnda behandlings- organ för generering av en uppsättning långsiktiga predikte- ringskoefficienter A för prediktering av en aktuell tidram xm hos den mottagna audiosignalen x direkt från åtminstone en tidigare tidram hos den kvantiserade audiosignalen X; ett genereringsorgan för generering av en predikterad audiosignal 2 med användande av predikteringskoefficienterna A och för jämförande av den mottagna audiosignalen x med den predikterade audiosignalen 2 för att generera en felsignal E(k) för var och en av ett flertal frekvensdelband; ett kvantiseringsorgan för kvantisering av felsigna- lerna E(k) för att generera en uppsättning kvantiserade fel- signaler É(k); och ett kombineringsorgan för kombinering av de kvantise- rade felsignalerna É(k) med predikteringskoefficienterna A för att generera en kodad audiosignal.
Vid en utföringsform innefattar nämnda genereringsorgan ett första transformorgan för transformering av den mottagna d- till frekvensdomäncn och ett andra transformorgan för transformering av den predikterade audio- signalen 2 från tid- till frekvensdomänen och är jämförelse- ., Ur. 521 129 6 organ inrättade att jämföra de resulterande frekvensdomän- signalerna i frekvensdomänen.
Vid en alternativ utföringsform av uppfinningen är genererings- organet inrättat att jämföra den mottagna audiosignalen x och den predikterade audiosignalen 2 i tiddomänen.
Enligt en fjärde aspekt av föreliggande uppfinning åstadkommes en anordning för avkodning av en kodad audiosignal x, där den kodade audiosignalen innefattar en kvantiserad felsignal É(k) för var och en av ett flertal frekvensdelband hos audio- signalen och en uppsättning predikteringskoefficienter A för varje tidram hos audiosignalen och predikteringskoefficienterna A kan användas för att prediktera en aktuell tidram xp hos den mottagna audiosignalen direkt från åtminstone en tidigare tid- ram hos en rekonstruerad, kvantiserad audiosignal 2, vilken anordning innefattar: en ingång för mottagning av den kodade audiosignalen; ett genereringsorgan för generering av nämnda rekon- struerade, kvantiserade audiosignal 2 utifrån de kvantiserade felsignalerna É(k); och ett signalbehandlingsorgan för generering av en predik- terad audiosignal 2 utifrån predikteringskoefficienterna A och nämnda rekonstruerade audiosignal 2, varvid nämnda genereringsorgan innefattar ett första transformeringsorgan för transformering av den predikterade audiosignalen R från tiddomänen till frekvensdomänen för att generera en uppsättning predikterade frekvensdelbandsignaler 2(k), ett kombineringsorgan för kombinering av nämnda upp- sättning predikterade frekvensdelbandsignaler Éjk) med de kvantiserade felsignalerna É(k) för att generera en upp- sättning rekonstruerade frekvensdelbandsignaler X(k), och ett andra transformeringsorgan för utförande av en frekvens- till tiddomäntransform på de rekonstruerade frekvensdelbandsigna- lerna X(k) för generering av den rekonstruerade, kvantiserade audiosignalen 2. 521 129 7 För en bättre förståelse av föreliggande uppfinning och för att visa hur denna kan genomföras kommer hänvisning nu att göras, såsom exempel, till bifogade ritningar, på vilka: Fig. l översiktligt visar en kodare för kodning av en mottagen audiosignal; Fig. 2 översiktligt visar en avkodare för avkodning av en audiosignal som kodats med kodaren i fig. l; Fig. 3 visar kodaren i fig. l mer i detalj inkluderande ett prediktorverktyg hos kodaren; Fig. 4 visar avkodaren i fig. 2 mer i detalj inkluderande ett prediktorverktyg hos avkodaren; och Fig. 5 visar i detalj en modifiering av kodaren i fig. l och som utnyttjar ett alternativt predikteringsverktyg.
I fig. l visas ett blockschema över en kodare som utför den kodningsfunktion som i allmänna termer definieras i MPEG-2 AAC- standarden. Insignalen till kodaren är en samplad monofassignal x, vars sampelpunkter grupperas till tidsramar eller block om 2N punkter, dvs xg=(xm(0),xm(l),...,x¿(2N-l))T (1) där m är blockindex och T anger transponering. Grupperingen av sampelpunkterna utförs av ett filterbankverktyg l som också utför en modifierad diskret cosinustransform (MDCT) på varje enskild ram av audiosignalen för att generera en uppsättning frekvensdelbandkoefficienter X;=(Xg(Û),Xg(1),---,Xg(N-1))T (2) Framåt-MDCT definieras av 521 129 s 2N-l xmm = 2 f i=O där f(i) är analys-syntes-fönstret, som är ett symmetriskt fönster så att dess adderade-överlappade effekt ger en för- stärkning av ett till signalen.
Frekvensdelbandsignalerna X(k) tillförs i sin tur ett predikte- ringsverktyg 2 (som beskrivs mer i detalj nedan), vilket för- söker eliminera den långsiktiga redundansen i varje delband- signal. Resultatet blir en uppsättning frekvensdelbandfelsigna- ler E,n(k)=(Em(0),E,,,(l),---,Em(N-l))T (4) som indikerar långsiktiga förändringar i respektive delband, och en uppsättning framåtadaptiva predikteringskoefficienter A för varje ram.
Delbandfelsignalerna E(k) tillförs en kvantiserare 3, vilken kvantiserar varje signal med ett antal bitar som bestäms av en psyko-akustisk modell. Denna modell tillämpas av en styrenhet 4. Såsom nämnts används den psyko-akustiska modellen för modellering av maskningsuppträdandet hos människans hörsel- system. De kvantiserade felsignalerna É(k) och predikterings- koefficienterna A kombineras därefter i en bitströmmultiplexor för överföring via en överföringskanal 6.
Fig. 2 visar den allmänna uppbyggnaden hos en avkodare för avkodning av en audiosignal som kodats med kodaren i fig. l. En bitströmmultiplexor 7 separerar först predikteringskoefficien- terna A från de kvantiserade felsignalerna É(k) och separerar felsignalerna i separata delbandsignaler. Predikteringskoeffi- cienterna A och de kvantiserade feldelbandsignalerna É(k) tillförs ett predikteringsverktyg 8, vilket omvänder den predikteringsprocess som utförs i kodaren, dvs predikterings- verktyget återinför den redundans som extraherats i kodaren, 1» .... -. H.- 521 129 9 för att generera återbildade, kvantiserade delbandsignaler X(k). Ett filterbankverktyg 9 återvinner därefter tiddomän- signalen X medelst en inverstransform på den mottagna versio- nen X(k), som beskrives av 17-'m(i) = Üm_1(i+N)+Ûm(i), (5) i = 0,m,Ap1 där ük(i),i = 0,~,2N-1 är inverstransformen av X N-l m ümu) = fu) J? (k) cos(.41“ñ(2i+1+1v) i = 0,---,2N-1 och som approximerar den ursprungliga audiosignalen x.
Fig. 3 illustrerar mer i detalj predikteringssättet hos kodaren i fig. 1. Med användande av de kvantiserade frekvensdelbandfel- signalerna E(k) genereras en uppsättning kvantiserade frekvens- delbandsignaler X(k) av en signalbehandlingsenhet 10. Signa- lerna X(k) tillförs i sin tur en filterbank ll som utför en modifierad diskret invers cosinustransform (IMDCT) på signaler- na för att generera en kvantiserad tiddomänsignal 2. Därefter tillförs signalen 2 ett långsiktigt prediktorverktyg 12 som också mottar audioinsignalen x. Prediktorverktyget 12 använder en långsiktig (LT) prediktor för att avlägsna redundansen i audiosignalen som finns i en aktuell ram m+l, baserat på det tidigare kvantiserade datat. Denna prediktors överförings- funktion P är: m2) = bkz-(fik) <5) k =_m1 där a representerar en lång fördröjning i området 1-1024 sampel och bk är predikteringskoefficienter. För mf¶m=O är prediktorn en tapp under det att för mfqm=l är prediktorn tre tappar.
» - J 1 « - . - - . H 521 129 Parametrarna a och in bestäms genom minimering av det kvadra- tiska medelvärdesfelet efter LT-prediktering över en period av 2N sampel. För en entappsprediktor ges LT-predikteringsresidua- len r(i) av: r(i)=x(i)-b2(i-2N+1-a) (6) där x är audiosignalen i tiddomänen och 2 är den kvantiserade tiddomänsignalen. Den kvadratiska medelvärdesresidualen R ges aVI ZN-l 2N-1 R= 2(') = ( (')-b"('"2 _ H2 (7) Z; r 1 2; .X 1 X 1 N41 a Om man sätter âR/âb=0 erhålles 2N-1 x(i)2(i-2N+1-a) 19 = 1-:N-1 (8) (xu-zN-a) )2 1=0 och om man ersätter b i ekvation (7) erhålles 2N-1 zwfl x(i)2(i-2N+1-a) R ~ xz-(i) ~ *šfm (9) l=° 2 (>"<(n-2N+1-a))2 1=0 Minimering av R innebär maximering av den andra termen i det högra ledet av ekvation (9). Denna term beräknas för samtliga möjliga värden på a över dess specificerade område och det värde på a som maximerar denna term väljs. Energin i nämnaren i ekvation (9), identifierad som Q, kan enkelt uppdateras från fördröjningen (a-1) till a i stället för omberäkning av den med användande av: Ûf=Ûf1+ X2(-d)- 22(-d+N) (10) 521 129 ll Om en entapps LT-prediktor används används ekvation (8) för att beräkna predikteringskoefficienten bj. För en j-tapprediktor bestäms först LT-predikteringsfördröjningen a genom maximering av den andra termen i ekvation (9) och därefter löses en upp- sättning jxj-ekvationer för beräkning av j-predikterings- koefficienterna.
LT-predikteringsparametrarna A är fördröjningen a och predikte- ringskoefficienten bj. Fördröjningen kvantiseras med 9-ll bitar beroende på det använda området. Vanligtvis används 10 bitar med 1024 möjliga värden i området 1-1024. För att minska antalet bitar kan LT-predikteringsfördröjningarna deltakodas i jämna ramar med 5 bitar. Experiment visar att det är tillräck- ligt att kvantisera förstärkningen med 3-6 bitar. Till följd av den ojämna fördelningen av förstärkningen måste icke-uniform kvantisering användas.
Vid det ovan beskrivna sättet garanteras inte alltid stabili- teten hos LT-syntesfiltret 1/P(z). För en entappsprediktor är stabilitetsvillkoret Ib|sl. Därför kan stabiliseringen enkelt utföras genom att man sätter absolutbeloppet 1b1=l när absolut- beloppet \bf>l. För en 3-tappsprediktor kan en annan stabilise- ringsprocedur användas, såsom den som beskrives i R.P. Rama- chandran och P. Kabal, "Stability and performance analysis of pitch filters in speech coders", IEEE Trans. ASSP, vol. 35, nr 7, sid. 937-946, juli 1987. Dock är inte instabiliteten hos LT- syntesfiltret alltid så skadlig för den rekonstruerade signa- lens kvalitet. Det instabila filtret varar under ett par ramar (ökande energin), men till slut erhålles perioder av stabilitet så att utsignalen inte fortsätter att öka med tiden.
Efter att LT-prediktorkoefficienterna har bestämts kan den predikterade signalen för den (m+l):te ramen bestämmas: mi) = 2 bjmi-zzxni-j-a), (ll) J :_1711 i=nmHl,nmH2,m,(m+1)N u .U- -1 ...u 521 129 12 Den predikterade tidsdomänsignalen 2 tillförs därefter en filterbank 13 som utför en MDCT på signalen för att generera predikterade spektralkoefficienter ÉmU(k) för den (m+l):te ramen. De predikterade spektralkoefficienterna 2(k) subtra- heras därefter från spektralkoefficienterna X(k) vid en subtraherare 14.
För att garantera att predikteringen endast används om den resulterar i en kodningsförbättring krävs en lämplig predik- torstyrning och en liten mängd prediktorstyrningsinformation måste sändas till avkodaren. Denna funktion utförs i subtrahe- raren 14. Prediktorstyrsättet är samma som för det bakåtriktade adaptiva prediktorstyrsättet som har använts vid MPEG-2 Advanced Audio Coding (AAC). Prediktorstyrningsinformationen för varje ram, som sänds som sidoinformation, bestäms i två steg. Först bestäms för varje skalningsfaktorband huruvida prediktering leder till en kodningsförbättring eller ej och om svaret är ja ställs prediktor_använd-biten för detta skal- ningsfaktorband till ett. Efter att detta har utförts för samt- liga skalningsfaktorband bestäms huruvida den totala kodnings- förbättringen genom prediktering i denna ram kompenserar åtmin- stone den ytterligare bit som krävs för prediktorsidoinforma- tionen. Om ja ställs prediktor_data_finns-biten till l och den fullständiga sidoinformationen, inklusive den som erfordras för prediktoråterställning, sänds och predikteringsfelvärdet till- förs kvantiseraren. I annat fall ställs prediktor_data_finns- biten till 0 och återställes samtliga prediktor_använd-bitar till noll och sänds inte. I detta fall tillförs spektralkompo- nentvärdet till kvantiseraren 3. Såsom beskrivits ovan fungerar prediktorstyrningen först på alla prediktorer i ett skalnings- faktorband och det följs därefter av ett andra steg över samt- liga skalningsfaktorband.
Det inses att syftet med LT-prediktering är att uppnå den största totala predikteringsförbättringen. Låt Glbeteckna predikteringsförstärkningen i det lzte frekvensdelbandet. Den totala predikteringsförbättringen i en given ram kan beräknas på följande sätt: . . . . » v _ « . , x s 521 129 13 *M G= X Gl (12) 1=1&G1>o) Om förstärkningen kompenserar den ytterligare biten som krävs för prediktorsidoinformationen, dvs G>T(dB), sänds den full- ständiga sidoinformationen och de prediktorer som ger positiva förbättringar slås till. I annat fall används inte predikto- Iêrna.
LP-parametrarna som erhålles genom ovan angivna sätt relateras inte direkt till maximering av förbättringen. Genom att beräkna förbättringen för varje block och för varje fördröjning inom det valda området (i detta exempel l-1024) och genom att välja den fördröjning som ger den största totala predikteringsför- bättringen, optimeras dock predikteringsprocessen. Den valda fördröjningen a och motsvarande koefficienter b sänds som sido- information med de kvantiserade feldelbandsignalerna. Även om beräkningskomplexiteten ökas vid kodaren uppkommer ingen ökning i komplexiteten vid avkodaren.
Fig. 4 visar mer i detalj avkodaren i fig. 2. Den kodade audio- signalen mottas från överföringskanalen 6 av bitströmsdemulti- plexorn 7, såsom beskrivits ovan. Bitströmsdemultiplexorn 7 separerar predikteringskoefficienterna A och de kvantiserade felsignalerna É(k) och tillför dessa till predikteringsverkty- get 8. Detta verktyg innefattar en kombinerare 24 som kombine- rar de kvantiserade felsignalerna É(k) och en predikterad audiosignal i frekvensdomänen X(k) för generering av en rekon- struerad audiosignal X(k) även i frekvensdomänen. Filterbanken 9 omvandlar den rekonstruerade signalen X(k) från frekvens- domänen till tidsdomänen för att generera en rekonstruerad tidsdomänaudiosignal 2 ill e Denna signal återkopplas i sin tur t långsiktigt predikteringsverktyg som även mottar Ü Ü 4..__.._'... ..._1..._._.C.C.' ___' _'I.4_ LCLLL bh LLLLL ....1_-.-.. -n n-4_ 1.°....,...__: 1-.1_.'...~ .,..,_,_,.1 ...-: ._ ut-:ina n. UCL, langalntlga piculntcilïïgö- (D .-._41 1.
LCLLLL Ti G verktyget 26 genererar en predikterad aktuell tidsram från föregående rekonstruerade tidramar med användande av predikte- ringskoefficienterna för den aktuella ramen. En filterbank 25 transformerar den predikterade signalen 2. 521 129 14 Det inses att prediktorstyrningsinformationen som sänds från kodaren kan användas vid avkodaren för styrning av avkodnings- operationen. Särskilt kan prediktor_använd-bitarna användas i kombineraren 24 för att bestämma huruvida prediktering har använts eller ej i varje givet frekvensband.
I fig. 5 visas en alternativ implementering av audiosignalkoda- ren i fig. 1, vid vilken en audiosignal x som skall kodas jäm- förs med den predikterade signalen 2 i tiddomänen av en kompa- rator 15 för att generera en felsignal e, även detta i tid- domänen. Därefter transformerar ett filterbankverktyg 16 fel- signalen från tiddomänen till frekvensdomänen för att generera en uppsättning frekvensdelbandfelsignaler E(k). Därefter kvan- tiseras dessa signaler av en kvantiserare 17 för att generera en uppsättning kvantiserade felsignaler É(k).
Därefter används en andra filterbank 18 för att omvandla de kvantiserade felsignalerna É(k) tillbaka till tiddomänen, vilket resulterar i en signal ë. Denna kvantiserade felsignal i tiddomänen ë kombineras därefter vid en signalbehandlings- enhet 19 med den predikterade audiosignalen i tiddomänen 2 för att generera en kvantiserad audiosignal X. Ett predikte- ringsverktyg 20 utför samma funktion som verktyget 12 hos kodaren i fig. 3, genererande den predikterade audiosignalen 2 och predikteringskoefficieterna A. Predikteringskoefficienterna och de kvantiserade felsignalerna kombineras vid en bitström- multiplexor 21 för överföring över överföringskanalen 22. Såsom beskrivits ovan kvantiseras felsignalerna i enlighet med en psyko-akustisk modell medelst en styrenhet 23.
De ovan beskrivna audiokodningsalgoritmerna möjliggör komprime- ring av audiosignaler vid låga bithastigheter. Denna teknik baseras på långsiktig prediktering (LT-prediktering). Jämfört med de kända bakåtriktade adaptiva predikteringsteknikerna ger de här beskrivna teknikerna högre predikteringsförbättringar för musiksignaler med ett instrument och talsignaler samtidigt som de endast kräver liten beräkningskomplexitet.

Claims (8)

f n ~ u | v v u » f .n 521 129 15 Patentkrav
1. Sätt att koda en audiosignal, vilket sätt innefattar följande steg: att man mottar en audiosignal x som skall kodas; att man genererar en kvantiserad audiosignal X från den mottagna audiosignalen x; att man genererar en uppsättning långsiktiga predikte- ringskoefficienter A som kan användas för att prediktera en aktuell tidsram hos den mottagna audiosignalen direkt från åtminstone en föregående tidsram hos den kvantiserade audio- signalen 2; att man använder predikteringskoefficienterna A för att generera en predikterad audiosignal 2; att man jämför den mottagna audiosignalen x med den predikterade audiosignalen 2 och genererar en felsignal E(k) för vart och ett av ett flertal frekvensdelband; att man kvantiserar felsignalerna E(k) för att generera en uppsättning kvantiserade felsignaler É(k); och att man kombinerar de kvantiserade felsignalerna É(k) och predikteringskoefficienterna A för att generera en kodad audiosignal.
2. Sätt enligt patentkrav l innefattande att man trans- formerar den mottagna audiosignalen x i ramar xm från tiddomä- nen till frekvensdomänen för att åstadkomma en uppsättning frekvensdelbandsignaler X(k) och transformerar den predikterade audiosignalen 2 från tiddomänen till frekvensdomänen för att generera en uppsättning predikterade frekvensdelbandsignaler É(k), varvid jämförelsen mellan den mottagna audiosignalen x och den predikterade audiosignalen 2 utförs i frekvensdomänen, och respektive delbandsignaler jämfö Ur »l + v « w qnnlv-fi FÅ att mA v LLLCKJ. VOLGLLKALO. .LkJL G generera frekvensdelbandfe signaler E(k).
3. Sätt enligt patentkrav 1, innefattande att man utför jämförelsen mellan den mottagna audiosignalen x och den predik- » ~ . , . f 521 129 16 terade audiosignalen 2 i tiddomänen för att generera en fel- signal e som också ligger i tiddomänen och omvandlar felsigna- len e från tid- till frekvensdomänen för att generera nämnda flertal frekvensdelbandfelsignaler E(k).
4. Sätt att avkoda en kodad audiosignal, vilket sätt inne- fattar följande steg: att man mottar en kodad audiosignal innefattande en kvantiserad felsignal É(k) för vart och ett av ett flertal frekvensdelband hos audiosignalen och, för varje tidsram av audiosignalen, en uppsättning predikteringskoefficienter A som kan användas för att prediktera en aktuell tidram xm hos den mottagna audiosignalen direkt från åtminstone en föregående tidram hos en rekonstruerad, kvantiserad audiosignal 2; att man genererar nämnda rekonstruerade, kvantiserade audiosignal 2 utifrån de kvantiserade felsignalerna É(k); att man använder predikteringskoefficienterna A och den kvantiserade audiosignalen 2 för att generera en predikterad audiosignal 2; att man transformerar den predikterade audiosignalen 2 från tiddomänen till frekvensdomänen för att generera en upp- sättning predikterade frekvensdelbandsignaler X(k) för kombi- nering med de kvantiserade felsignalerna É(k) för att generera en uppsättning rekonstruerade frekvensdelbandsignaler X(k); och att man utför en frekvens- till tiddomäntransform på de rekonstruerade frekvensdelbandsignalerna X(k) för att generera den rekonstruerade, kvantiserade audiosignalen 2.
5. Anordning för kodning av en audiosignal, vilken anord- ning innefattar: en ingång för mottagning av en audiosignal x som skall kodas; ett behandlingsorgan (2, 3; 15-19) kopplat till nämnda ingång för generering utifrån den mottagna audiosignalen x av en kvantiserad audiosignal 2; 521 129 17 ett predikteringsorgan (l2; 19) kopplat till nämnda behandlingsorgan (3) för generering av en uppsättning lång- siktiga predikteringskoefficienter A för prediktering av en aktuell tidram xm hos den mottagna audiosignalen x direkt från åtminstone en tidigare tidram hos den kvantiserade audiosigna- len 2; ett genereringsorgan (10-14; 20, 15) för generering av en predikterad audiosignal 2 med användande av predikterings- koefficienterna A och för jämförande av den mottagna audio- signalen x med den predikterade audiosignalen 2 för att gene- rera en felsignal E(k) för var och en av ett flertal frekvens- delband; ett kvantiseringsorgan (3; 17) för kvantisering av fel- signalerna E(k) för att generera en uppsättning kvantiserade felsignaler É(k); och ett kombineringsorgan (5; 21) för kombinering av de kvantiserade felsignalerna É(k) med predikteringskoefficien- terna A för att generera en kodad audiosignal.
6. Anordning enligt patentkrav 5, vid vilken nämnda gene- reringsorgan innefattar ett första transformorgan (11) för transformering av den mottagna audiosignalen x från tid- till frekvensdomänen och ett andra transformorgan (13) för trans- formering av den predikterade audiosignalen 2 från tid- till frekvensdomänen, och ett jämförelseorgan (14) inrättat att jämföra de resulterande frekvensdomänsignalerna i frekvens- domänen.
7. Anordning enligt patentkrav 6, vid vilken genererings- organet är inrättat att jämföra den mottagna audiosignalen x och den predikterade audiosignalen 2 i tiddomänen.
8. Anordning för avkodning av en kodad audiosignal x, där den kodade audiosignalen innefattar en kvantiserad felsignal É(k) för var och en av ett flertal frekvensdelband hos audio- signalen och en uppsättning predikteringskoefficienter A för varje tidram hos audiosignalen och predikteringskoefficienterna A kan användas för att prediktera en aktuell tidram xn hos den , , . . _, 521 129 18 mottagna audiosignalen direkt från åtminstone en tidigare tid- ram hos en rekonstruerad, kvantiserad audiosignal 2, vilken anordning innefattar: en ingång för mottagning av den kodade audiosignalen; ett genereringsorgan (24, 25, 9) för generering av nämnda rekonstruerade, kvantiserade audiosignal 2 utifrån de kvantiserade felsignalerna É(k); och ett signalbehandlingsorgan (26) för generering av en predikterad audiosignal 2 utifrån predikteringskoefficienterna A och nämnda rekonstruerade audiosignal X, varvid nämnda genereringsorgan innefattar ett första transformeringsorgan (25) för transformering av den predikte- rade audiosignalen 2 från tiddomänen till frekvensdomänen för att generera en uppsättning predikterade frekvensdelband- signaler É(k), ett kombineringsorgan (24) för kombinering av nämnda uppsättning predikterade frekvensdelbandsignaler É(k) med de kvantiserade felsignalerna É(k) för att generera en uppsättning rekonstruerade frekvensdelbandsignaler X(k), och ett andra transformeringsorgan (9) för utförande av en frekvens- till tiddomäntransform på de rekonstruerade frek- vensdelbandsignalerna X(k) för generering av den rekonstrue- rade, kvantiserade audiosignalen 2.
SE9800776A 1997-03-14 1998-03-10 Sätt och anordning för audiokodning SE521129C2 (sv)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FI971108A FI114248B (sv) 1997-03-14 1997-03-14 Förfarande och anordning för audiokodning och audioavkodning

Publications (3)

Publication Number Publication Date
SE9800776D0 SE9800776D0 (sv) 1998-03-10
SE9800776L SE9800776L (sv) 1998-09-15
SE521129C2 true SE521129C2 (sv) 2003-09-30

Family

ID=8548401

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9800776A SE521129C2 (sv) 1997-03-14 1998-03-10 Sätt och anordning för audiokodning

Country Status (13)

Country Link
US (2) US6721700B1 (sv)
EP (1) EP0966793B1 (sv)
JP (2) JP3391686B2 (sv)
KR (1) KR100469002B1 (sv)
CN (1) CN1135721C (sv)
AU (1) AU733156B2 (sv)
DE (1) DE19811039B4 (sv)
ES (1) ES2164414T3 (sv)
FI (1) FI114248B (sv)
FR (1) FR2761801B1 (sv)
GB (1) GB2323759B (sv)
SE (1) SE521129C2 (sv)
WO (1) WO1998042083A1 (sv)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2380640A (en) * 2001-08-21 2003-04-09 Micron Technology Inc Data compression method
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7016547B1 (en) 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
ES2334934T3 (es) 2002-09-04 2010-03-17 Microsoft Corporation Codificacion de entropia por adaptacion de codificacion entre modalidades de nivel y de longitud de sucesion y nivel.
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
TWI220753B (en) * 2003-01-20 2004-09-01 Mediatek Inc Method for determining quantization parameters
US7782954B2 (en) 2003-09-07 2010-08-24 Microsoft Corporation Scan patterns for progressive video content
US7688894B2 (en) 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
US7724827B2 (en) 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
WO2005034092A2 (en) * 2003-09-29 2005-04-14 Handheld Entertainment, Inc. Method and apparatus for coding information
TWI227866B (en) * 2003-11-07 2005-02-11 Mediatek Inc Subband analysis/synthesis filtering method
US7933767B2 (en) * 2004-12-27 2011-04-26 Nokia Corporation Systems and methods for determining pitch lag for a current frame of information
EP2290824B1 (en) * 2005-01-12 2012-05-23 Nippon Telegraph And Telephone Corporation Long term prediction coding and decoding method, devices thereof, program thereof, and recording medium
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7693709B2 (en) 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7684981B2 (en) 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US7565018B2 (en) * 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
GB2436192B (en) * 2006-03-14 2008-03-05 Motorola Inc Speech communication unit integrated circuit and method therefor
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
RU2464650C2 (ru) * 2006-12-13 2012-10-20 Панасоник Корпорэйшн Устройство и способ кодирования, устройство и способ декодирования
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
US20100292986A1 (en) * 2007-03-16 2010-11-18 Nokia Corporation encoder
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
CN101075436B (zh) * 2007-06-26 2011-07-13 北京中星微电子有限公司 带补偿的音频编、解码方法及装置
US20090048827A1 (en) * 2007-08-17 2009-02-19 Manoj Kumar Method and system for audio frame estimation
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
WO2009132662A1 (en) * 2008-04-28 2009-11-05 Nokia Corporation Encoding/decoding for improved frequency response
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
CN104240713A (zh) * 2008-09-18 2014-12-24 韩国电子通信研究院 编码方法和解码方法
WO2010091554A1 (zh) * 2009-02-13 2010-08-19 华为技术有限公司 一种基音周期检测方法和装置
DE102010006573B4 (de) * 2010-02-02 2012-03-15 Rohde & Schwarz Gmbh & Co. Kg IQ-Datenkompression für Breitbandanwendungen
CA3054712C (en) 2013-01-08 2020-06-09 Lars Villemoes Model based prediction in a critically sampled filterbank
WO2018101868A1 (en) * 2016-12-02 2018-06-07 Dirac Research Ab Processing of an audio input signal
CN112564713B (zh) * 2020-11-30 2023-09-19 福州大学 高效率低时延的动觉信号编解码器及编解码方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5921039B2 (ja) 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
GB8803390D0 (en) 1988-02-13 1988-03-16 Univ Belfast Method and apparatus for electrical signal coding
FR2628589B1 (fr) * 1988-03-14 1994-03-04 Etat Francais Codeur differentiel a filtre predicteur auto-adaptatif et decodeur utilisable en liaison avec un tel codeur
EP0364647B1 (en) * 1988-10-19 1995-02-22 International Business Machines Corporation Improvement to vector quantizing coder
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
FR2646978B1 (fr) 1989-05-11 1991-08-23 France Etat Procede et installation a codage de signaux sonores
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
JPH04119542A (ja) * 1990-09-07 1992-04-21 Nikon Corp 光磁気記録媒体カートリッジ
US5206884A (en) 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
FI95085C (sv) 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd En metod för digital kodning av en talsignal samt talkoder för utförande av förfarandet
FI91345C (sv) 1992-06-24 1994-06-10 Nokia Mobile Phones Ltd Förfarande för att effektivera kanalväxling
GB2282943B (en) * 1993-03-26 1998-06-03 Motorola Inc Vector quantizer method and apparatus
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
FI98163C (sv) * 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Kodningssystem för parametrisk talkodning
EP0709981B1 (en) * 1994-10-28 2002-01-09 RAI RADIOTELEVISIONE ITALIANA (S.p.A.) Subband coding with pitchband predictive coding in each subband
DK0799531T3 (da) * 1994-12-20 2000-07-10 Dolby Lab Licensing Corp Fremgangsmådeapparat til at anvende bølgeformsforudsigelse til underbånd af et kodningssystem, der vedrører sanseopfattelse
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
TW321810B (sv) * 1995-10-26 1997-12-01 Sony Co Ltd
JP3481027B2 (ja) * 1995-12-18 2003-12-22 沖電気工業株式会社 音声符号化装置
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
FI964975A (sv) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Förfarande och anordning för talkodning

Also Published As

Publication number Publication date
FI971108A (sv) 1998-09-15
WO1998042083A1 (en) 1998-09-24
GB9805294D0 (en) 1998-05-06
SE9800776D0 (sv) 1998-03-10
JP3391686B2 (ja) 2003-03-31
KR100469002B1 (ko) 2005-01-29
CN1195930A (zh) 1998-10-14
SE9800776L (sv) 1998-09-15
AU6216498A (en) 1998-10-12
FR2761801A1 (fr) 1998-10-09
DE19811039B4 (de) 2005-07-21
DE19811039A1 (de) 1998-09-17
FI971108A0 (sv) 1997-03-14
JP2003140697A (ja) 2003-05-16
GB2323759B (en) 2002-01-16
JPH10282999A (ja) 1998-10-23
AU733156B2 (en) 2001-05-10
EP0966793B1 (en) 2001-09-19
CN1135721C (zh) 2004-01-21
US6721700B1 (en) 2004-04-13
EP0966793A1 (en) 1999-12-29
US7194407B2 (en) 2007-03-20
ES2164414T3 (es) 2002-02-16
US20040093208A1 (en) 2004-05-13
GB2323759A (en) 1998-09-30
FI114248B (sv) 2004-09-15
KR20000076273A (ko) 2000-12-26
FR2761801B1 (fr) 1999-12-31

Similar Documents

Publication Publication Date Title
SE521129C2 (sv) Sätt och anordning för audiokodning
EP2947652B1 (en) Decoding of a stereo audio signal using complex prediction
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
KR100304092B1 (ko) 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP4081447B2 (ja) 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法
JP5324450B2 (ja) 音声信号の符号変換のための方法及び装置
WO2008072670A1 (ja) 符号化装置、復号装置、およびこれらの方法
JP3636094B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPH11143499A (ja) 切替え型予測量子化の改良された方法
WO2014096236A2 (en) Signal adaptive fir/iir predictors for minimizing entropy
JP2000338998A (ja) オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JP2006145782A (ja) オーディオ信号符号化装置および方法
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR19980080742A (ko) 신호 부호화방법 및 장치
Muin et al. A review of lossless audio compression standards and algorithms
JP2010256932A (ja) 音声信号標本値の符号化または復号化のための方法並びに符号化器ないし復号化器
JP4618823B2 (ja) 信号符号化装置及び方法
JPS62224122A (ja) 信号符号化方法
JPH08137494A (ja) 音響信号符号化装置、音響信号復号装置および音響信号処理装置

Legal Events

Date Code Title Description
NUG Patent has lapsed