SE521129C2 - Sätt och anordning för audiokodning - Google Patents
Sätt och anordning för audiokodningInfo
- Publication number
- SE521129C2 SE521129C2 SE9800776A SE9800776A SE521129C2 SE 521129 C2 SE521129 C2 SE 521129C2 SE 9800776 A SE9800776 A SE 9800776A SE 9800776 A SE9800776 A SE 9800776A SE 521129 C2 SE521129 C2 SE 521129C2
- Authority
- SE
- Sweden
- Prior art keywords
- audio signal
- quantized
- generate
- frequency
- predicted
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000005236 sound signal Effects 0.000 claims abstract description 137
- 230000001131 transforming effect Effects 0.000 claims abstract description 15
- 230000007774 longterm Effects 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 description 12
- 230000006872 improvement Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
Description
- . . » « a 521 129 2 tillgång till stora mängder minne för lagring av de beräknade koefficienterna och mellankoefficienter. Det är välkänt att då bakåtriktade adaptiva prediktorer av denna typ används i frek- vensdomänen är det svårt att ytterligare minska beräknings- belastningarna och minneskraven. Anledningen till detta är att antalet prediktorer är så stort i frekvensdomänen att till och med en mycket enkel adaptiv algoritm ändå ger stor beräknings- komplexitet och minneskrav. Även om det är känt att undvika detta problem genom att utnyttja framåtriktade adaptiva predik- torer som uppdateras i kodaren och överförs till avkodaren, resulterar ändå användningen av framåtriktade adaptiva predik- torer i frekvensdomänen oundvikligen i en stor mängd "sido"- information eftersom antalet prediktorer är så stort.
Ett ändamål med föreliggande uppfinning är att undvika eller åtminstone minska nackdelarna hos kända predikteringssätt.
Detta och andra ändamål uppnås genom kodning av en audiosignal med användande av felsignaler för att avlägsna redundans i vart och ett av ett flertal frekvensdelband hos audiosignalen och dessutom generera långsiktiga predikteringskoefficienter i tidsdomänen som möjliggör prediktering av en aktuell ram hos audiosignalen utifrån en eller fler tidigare ramar.
Enligt en första aspekt av föreliggande uppfinning åstadkommes ett sätt att koda en audiosignal, vilket sätt innefattar följande steg: att man mottar en audiosignal x som skall kodas; att man genererar en kvantiserad audiosignal 2 från den mottagna audiosignalen x; att man genererar en uppsättning långsiktiga predikte- ringskoefficienter A som kan användas för att prediktera en aktuell tidsram hos den mottagna audiosignalen direkt från åtminstone en föregående tidsram hos den kvantiserade audio- signalen X; man använder predikteringskoeff*cienterna A för att generera en predikterad audiosignal 2; att man jämför den mottagna audiosignalen x med den predikterade audiosignalen 2 och genererar en felsignal E(k) ~ , 1 . = . . « - ; I v 521 129 3 för vart och ett av ett flertal frekvensdelband; att man kvantiserar felsignalerna E(k) för att generera en uppsättning kvantiserade felsignaler É(k); och att man kombinerar de kvantiserade felsignalerna É(k) och predikteringskoefficienterna A för att generera en kodad audiosignal.
Föreliggande uppfinning ger komprimering av en audiosignal med användande av en framåtriktad adaptiv prediktor i tidsdomänen.
För varje tidsram hos en mottagen signal är det bara nödvändigt att generera och sända en enda uppsättning framåtriktade adap- tiva predikteringskoefficienter för överföring till avkodaren.
Detta skiljer sig från kända framåtriktade adaptiva predikte- ringstekniker som kräver generering av en uppsättning predikte- ringskoefficienter för varje frekvensdelband hos varje tidsram.
Jämfört med de predikteringsförbättringar som erhålles med föreliggande uppfinning är sidoinformationen hos den långsikti- ga prediktorn försumbar.
Vissa utföringsformer av föreliggande uppfinning möjliggör en minskning av beräkningskomplexiteten och minneskraven. Jämfört med användningen av bakåtriktad adaptiv prediktering föreligger särskilt inget krav att på nytt beräkna predikteringskoeffi- cienterna i avkodaren. Vissa utföringsformer av uppfinningen kan också reagera snabbare på signaländringar än konventio- nella, bakåtriktade adaptiva prediktorer.
Vid en utföringsform av uppfinningen transformeras den mottagna audiosignalen x i ramar xm från tidsdomänen till frekvensdomä- nen för att ge en uppsättning frekvensdelbandsignaler X(k). Den predikterade audiosignalen 2 transformeras på liknande sätt från tidsdomänen till frekvensdomänen för att generera en upp- sättning predikterade frekvensdelbandsignaler X(k) och jäm- förelsen mellan den mottagna audiosignalen x och den predikte- rade audiosignalen 2 utförs i frekvensdomänen, varvid respek- tive delbandsignaler jämförs med varandra för att generera frekvensdelbandfelsignaler E(k). Den kvantiserade audiosignalen 2 genereras genom summering av den predikterade signalen och . , . . x n 521 129 4 den kvantiserade felsignalen, antingen i tidsdomänen eller i frekvensdomänen.
Vid en alternativ utföringsform av uppfinningen utförs jäm- förelsen mellan den mottagna audiosignalen x och den predikte- rade audiosignalen 2 i tidsdomänen för att generera en fel- signal e som också ligger i tidsdomänen. Denna felsignal e omvandlas därefter från tid- till frekvensdomänen för att generera nämnda flertal frekvensdelbandfelsignaler E(k).
Företrädesvis utförs kvantiseringen av felsignalerna enligt en psyko-akustisk modell.
Enligt en andra aspekt av föreliggande uppfinning åstadkommes ett sätt att avkoda en kodad audiosignal, vilket sätt inne- fattar följande steg: att man mottar en kodad audiosignal innefattande en kvantiserad felsignal É(k) för vart och ett av ett flertal frekvensdelband hos audiosignalen och, för varje tidsram av audiosignalen, en uppsättning predikteringskoefficienter A som kan användas för att prediktera en aktuell tidram xp hos den mottagna audiosignalen direkt från åtminstone en föregående tidram hos en rekonstruerad, kvantiserad audiosignal X; att man genererar nämnda rekonstruerade, kvantiserade audiosignal 2 utifrån de kvantiserade felsignalerna É(k); att man använder predikteringskoefficienterna A och den kvantiserade audiosignalen 2 för att generera en predikterad audiosignal 2; att man transformerar den predikterade audiosignalen 2 från tiddomänen till frekvensdomänen för att generera en upp- sättning predikterade frekvensdelbandsignaler X(k) för kombi- nering med de kvantiserade felsignalerna É(k) för att generera en uppsättning rekonstruerade frekvensdelbandsignaler X(k); och att man utför en frekvens- till tiddomäntransform på de rekonstruerade frekvensdelbandsignalerna X(k) för att generera den rekonstruerade, kvantiserade audiosignalen X. . . . = 4 . : . - , . 1 521 129 Utföringsformer av ovannämnda andra aspekt av uppfinningen kan särskilt tillämpas då endast en delmängd av samtliga möjliga kvantiserade felsignaler É(k) mottages, varvid visst delband- data överförs direkt genom överföringen av audiodelbandsignaler X(k). Signalerna X(k) och X(k) kombineras på lämpligt sätt innan frekvens- till tidtransformen utförs.
Enligt en tredje aspekt av föreliggande uppfinning åstadkommes en anordning för kodning av en audiosignal, vilken anordning innefattar: en ingång för mottagning av en audiosignal x som skall kodas; ett behandlingsorgan kopplat till nämnda ingång för generering utifrån den mottagna audiosignalen x av en kvanti- serad audiosignal X; ett predikteringsorgan kopplat till nämnda behandlings- organ för generering av en uppsättning långsiktiga predikte- ringskoefficienter A för prediktering av en aktuell tidram xm hos den mottagna audiosignalen x direkt från åtminstone en tidigare tidram hos den kvantiserade audiosignalen X; ett genereringsorgan för generering av en predikterad audiosignal 2 med användande av predikteringskoefficienterna A och för jämförande av den mottagna audiosignalen x med den predikterade audiosignalen 2 för att generera en felsignal E(k) för var och en av ett flertal frekvensdelband; ett kvantiseringsorgan för kvantisering av felsigna- lerna E(k) för att generera en uppsättning kvantiserade fel- signaler É(k); och ett kombineringsorgan för kombinering av de kvantise- rade felsignalerna É(k) med predikteringskoefficienterna A för att generera en kodad audiosignal.
Vid en utföringsform innefattar nämnda genereringsorgan ett första transformorgan för transformering av den mottagna d- till frekvensdomäncn och ett andra transformorgan för transformering av den predikterade audio- signalen 2 från tid- till frekvensdomänen och är jämförelse- ., Ur. 521 129 6 organ inrättade att jämföra de resulterande frekvensdomän- signalerna i frekvensdomänen.
Vid en alternativ utföringsform av uppfinningen är genererings- organet inrättat att jämföra den mottagna audiosignalen x och den predikterade audiosignalen 2 i tiddomänen.
Enligt en fjärde aspekt av föreliggande uppfinning åstadkommes en anordning för avkodning av en kodad audiosignal x, där den kodade audiosignalen innefattar en kvantiserad felsignal É(k) för var och en av ett flertal frekvensdelband hos audio- signalen och en uppsättning predikteringskoefficienter A för varje tidram hos audiosignalen och predikteringskoefficienterna A kan användas för att prediktera en aktuell tidram xp hos den mottagna audiosignalen direkt från åtminstone en tidigare tid- ram hos en rekonstruerad, kvantiserad audiosignal 2, vilken anordning innefattar: en ingång för mottagning av den kodade audiosignalen; ett genereringsorgan för generering av nämnda rekon- struerade, kvantiserade audiosignal 2 utifrån de kvantiserade felsignalerna É(k); och ett signalbehandlingsorgan för generering av en predik- terad audiosignal 2 utifrån predikteringskoefficienterna A och nämnda rekonstruerade audiosignal 2, varvid nämnda genereringsorgan innefattar ett första transformeringsorgan för transformering av den predikterade audiosignalen R från tiddomänen till frekvensdomänen för att generera en uppsättning predikterade frekvensdelbandsignaler 2(k), ett kombineringsorgan för kombinering av nämnda upp- sättning predikterade frekvensdelbandsignaler Éjk) med de kvantiserade felsignalerna É(k) för att generera en upp- sättning rekonstruerade frekvensdelbandsignaler X(k), och ett andra transformeringsorgan för utförande av en frekvens- till tiddomäntransform på de rekonstruerade frekvensdelbandsigna- lerna X(k) för generering av den rekonstruerade, kvantiserade audiosignalen 2. 521 129 7 För en bättre förståelse av föreliggande uppfinning och för att visa hur denna kan genomföras kommer hänvisning nu att göras, såsom exempel, till bifogade ritningar, på vilka: Fig. l översiktligt visar en kodare för kodning av en mottagen audiosignal; Fig. 2 översiktligt visar en avkodare för avkodning av en audiosignal som kodats med kodaren i fig. l; Fig. 3 visar kodaren i fig. l mer i detalj inkluderande ett prediktorverktyg hos kodaren; Fig. 4 visar avkodaren i fig. 2 mer i detalj inkluderande ett prediktorverktyg hos avkodaren; och Fig. 5 visar i detalj en modifiering av kodaren i fig. l och som utnyttjar ett alternativt predikteringsverktyg.
I fig. l visas ett blockschema över en kodare som utför den kodningsfunktion som i allmänna termer definieras i MPEG-2 AAC- standarden. Insignalen till kodaren är en samplad monofassignal x, vars sampelpunkter grupperas till tidsramar eller block om 2N punkter, dvs xg=(xm(0),xm(l),...,x¿(2N-l))T (1) där m är blockindex och T anger transponering. Grupperingen av sampelpunkterna utförs av ett filterbankverktyg l som också utför en modifierad diskret cosinustransform (MDCT) på varje enskild ram av audiosignalen för att generera en uppsättning frekvensdelbandkoefficienter X;=(Xg(Û),Xg(1),---,Xg(N-1))T (2) Framåt-MDCT definieras av 521 129 s 2N-l xmm = 2 f i=O där f(i) är analys-syntes-fönstret, som är ett symmetriskt fönster så att dess adderade-överlappade effekt ger en för- stärkning av ett till signalen.
Frekvensdelbandsignalerna X(k) tillförs i sin tur ett predikte- ringsverktyg 2 (som beskrivs mer i detalj nedan), vilket för- söker eliminera den långsiktiga redundansen i varje delband- signal. Resultatet blir en uppsättning frekvensdelbandfelsigna- ler E,n(k)=(Em(0),E,,,(l),---,Em(N-l))T (4) som indikerar långsiktiga förändringar i respektive delband, och en uppsättning framåtadaptiva predikteringskoefficienter A för varje ram.
Delbandfelsignalerna E(k) tillförs en kvantiserare 3, vilken kvantiserar varje signal med ett antal bitar som bestäms av en psyko-akustisk modell. Denna modell tillämpas av en styrenhet 4. Såsom nämnts används den psyko-akustiska modellen för modellering av maskningsuppträdandet hos människans hörsel- system. De kvantiserade felsignalerna É(k) och predikterings- koefficienterna A kombineras därefter i en bitströmmultiplexor för överföring via en överföringskanal 6.
Fig. 2 visar den allmänna uppbyggnaden hos en avkodare för avkodning av en audiosignal som kodats med kodaren i fig. l. En bitströmmultiplexor 7 separerar först predikteringskoefficien- terna A från de kvantiserade felsignalerna É(k) och separerar felsignalerna i separata delbandsignaler. Predikteringskoeffi- cienterna A och de kvantiserade feldelbandsignalerna É(k) tillförs ett predikteringsverktyg 8, vilket omvänder den predikteringsprocess som utförs i kodaren, dvs predikterings- verktyget återinför den redundans som extraherats i kodaren, 1» .... -. H.- 521 129 9 för att generera återbildade, kvantiserade delbandsignaler X(k). Ett filterbankverktyg 9 återvinner därefter tiddomän- signalen X medelst en inverstransform på den mottagna versio- nen X(k), som beskrives av 17-'m(i) = Üm_1(i+N)+Ûm(i), (5) i = 0,m,Ap1 där ük(i),i = 0,~,2N-1 är inverstransformen av X N-l m ümu) = fu) J? (k) cos(.41“ñ(2i+1+1v) i = 0,---,2N-1 och som approximerar den ursprungliga audiosignalen x.
Fig. 3 illustrerar mer i detalj predikteringssättet hos kodaren i fig. 1. Med användande av de kvantiserade frekvensdelbandfel- signalerna E(k) genereras en uppsättning kvantiserade frekvens- delbandsignaler X(k) av en signalbehandlingsenhet 10. Signa- lerna X(k) tillförs i sin tur en filterbank ll som utför en modifierad diskret invers cosinustransform (IMDCT) på signaler- na för att generera en kvantiserad tiddomänsignal 2. Därefter tillförs signalen 2 ett långsiktigt prediktorverktyg 12 som också mottar audioinsignalen x. Prediktorverktyget 12 använder en långsiktig (LT) prediktor för att avlägsna redundansen i audiosignalen som finns i en aktuell ram m+l, baserat på det tidigare kvantiserade datat. Denna prediktors överförings- funktion P är: m2) = bkz-(fik) <5) k =_m1 där a representerar en lång fördröjning i området 1-1024 sampel och bk är predikteringskoefficienter. För mf¶m=O är prediktorn en tapp under det att för mfqm=l är prediktorn tre tappar.
» - J 1 « - . - - . H 521 129 Parametrarna a och in bestäms genom minimering av det kvadra- tiska medelvärdesfelet efter LT-prediktering över en period av 2N sampel. För en entappsprediktor ges LT-predikteringsresidua- len r(i) av: r(i)=x(i)-b2(i-2N+1-a) (6) där x är audiosignalen i tiddomänen och 2 är den kvantiserade tiddomänsignalen. Den kvadratiska medelvärdesresidualen R ges aVI ZN-l 2N-1 R= 2(') = ( (')-b"('"2 _ H2 (7) Z; r 1 2; .X 1 X 1 N41 a Om man sätter âR/âb=0 erhålles 2N-1 x(i)2(i-2N+1-a) 19 = 1-:N-1 (8) (xu-zN-a) )2 1=0 och om man ersätter b i ekvation (7) erhålles 2N-1 zwfl x(i)2(i-2N+1-a) R ~ xz-(i) ~ *šfm (9) l=° 2 (>"<(n-2N+1-a))2 1=0 Minimering av R innebär maximering av den andra termen i det högra ledet av ekvation (9). Denna term beräknas för samtliga möjliga värden på a över dess specificerade område och det värde på a som maximerar denna term väljs. Energin i nämnaren i ekvation (9), identifierad som Q, kan enkelt uppdateras från fördröjningen (a-1) till a i stället för omberäkning av den med användande av: Ûf=Ûf1+ X2(-d)- 22(-d+N) (10) 521 129 ll Om en entapps LT-prediktor används används ekvation (8) för att beräkna predikteringskoefficienten bj. För en j-tapprediktor bestäms först LT-predikteringsfördröjningen a genom maximering av den andra termen i ekvation (9) och därefter löses en upp- sättning jxj-ekvationer för beräkning av j-predikterings- koefficienterna.
LT-predikteringsparametrarna A är fördröjningen a och predikte- ringskoefficienten bj. Fördröjningen kvantiseras med 9-ll bitar beroende på det använda området. Vanligtvis används 10 bitar med 1024 möjliga värden i området 1-1024. För att minska antalet bitar kan LT-predikteringsfördröjningarna deltakodas i jämna ramar med 5 bitar. Experiment visar att det är tillräck- ligt att kvantisera förstärkningen med 3-6 bitar. Till följd av den ojämna fördelningen av förstärkningen måste icke-uniform kvantisering användas.
Vid det ovan beskrivna sättet garanteras inte alltid stabili- teten hos LT-syntesfiltret 1/P(z). För en entappsprediktor är stabilitetsvillkoret Ib|sl. Därför kan stabiliseringen enkelt utföras genom att man sätter absolutbeloppet 1b1=l när absolut- beloppet \bf>l. För en 3-tappsprediktor kan en annan stabilise- ringsprocedur användas, såsom den som beskrives i R.P. Rama- chandran och P. Kabal, "Stability and performance analysis of pitch filters in speech coders", IEEE Trans. ASSP, vol. 35, nr 7, sid. 937-946, juli 1987. Dock är inte instabiliteten hos LT- syntesfiltret alltid så skadlig för den rekonstruerade signa- lens kvalitet. Det instabila filtret varar under ett par ramar (ökande energin), men till slut erhålles perioder av stabilitet så att utsignalen inte fortsätter att öka med tiden.
Efter att LT-prediktorkoefficienterna har bestämts kan den predikterade signalen för den (m+l):te ramen bestämmas: mi) = 2 bjmi-zzxni-j-a), (ll) J :_1711 i=nmHl,nmH2,m,(m+1)N u .U- -1 ...u 521 129 12 Den predikterade tidsdomänsignalen 2 tillförs därefter en filterbank 13 som utför en MDCT på signalen för att generera predikterade spektralkoefficienter ÉmU(k) för den (m+l):te ramen. De predikterade spektralkoefficienterna 2(k) subtra- heras därefter från spektralkoefficienterna X(k) vid en subtraherare 14.
För att garantera att predikteringen endast används om den resulterar i en kodningsförbättring krävs en lämplig predik- torstyrning och en liten mängd prediktorstyrningsinformation måste sändas till avkodaren. Denna funktion utförs i subtrahe- raren 14. Prediktorstyrsättet är samma som för det bakåtriktade adaptiva prediktorstyrsättet som har använts vid MPEG-2 Advanced Audio Coding (AAC). Prediktorstyrningsinformationen för varje ram, som sänds som sidoinformation, bestäms i två steg. Först bestäms för varje skalningsfaktorband huruvida prediktering leder till en kodningsförbättring eller ej och om svaret är ja ställs prediktor_använd-biten för detta skal- ningsfaktorband till ett. Efter att detta har utförts för samt- liga skalningsfaktorband bestäms huruvida den totala kodnings- förbättringen genom prediktering i denna ram kompenserar åtmin- stone den ytterligare bit som krävs för prediktorsidoinforma- tionen. Om ja ställs prediktor_data_finns-biten till l och den fullständiga sidoinformationen, inklusive den som erfordras för prediktoråterställning, sänds och predikteringsfelvärdet till- förs kvantiseraren. I annat fall ställs prediktor_data_finns- biten till 0 och återställes samtliga prediktor_använd-bitar till noll och sänds inte. I detta fall tillförs spektralkompo- nentvärdet till kvantiseraren 3. Såsom beskrivits ovan fungerar prediktorstyrningen först på alla prediktorer i ett skalnings- faktorband och det följs därefter av ett andra steg över samt- liga skalningsfaktorband.
Det inses att syftet med LT-prediktering är att uppnå den största totala predikteringsförbättringen. Låt Glbeteckna predikteringsförstärkningen i det lzte frekvensdelbandet. Den totala predikteringsförbättringen i en given ram kan beräknas på följande sätt: . . . . » v _ « . , x s 521 129 13 *M G= X Gl (12) 1=1&G1>o) Om förstärkningen kompenserar den ytterligare biten som krävs för prediktorsidoinformationen, dvs G>T(dB), sänds den full- ständiga sidoinformationen och de prediktorer som ger positiva förbättringar slås till. I annat fall används inte predikto- Iêrna.
LP-parametrarna som erhålles genom ovan angivna sätt relateras inte direkt till maximering av förbättringen. Genom att beräkna förbättringen för varje block och för varje fördröjning inom det valda området (i detta exempel l-1024) och genom att välja den fördröjning som ger den största totala predikteringsför- bättringen, optimeras dock predikteringsprocessen. Den valda fördröjningen a och motsvarande koefficienter b sänds som sido- information med de kvantiserade feldelbandsignalerna. Även om beräkningskomplexiteten ökas vid kodaren uppkommer ingen ökning i komplexiteten vid avkodaren.
Fig. 4 visar mer i detalj avkodaren i fig. 2. Den kodade audio- signalen mottas från överföringskanalen 6 av bitströmsdemulti- plexorn 7, såsom beskrivits ovan. Bitströmsdemultiplexorn 7 separerar predikteringskoefficienterna A och de kvantiserade felsignalerna É(k) och tillför dessa till predikteringsverkty- get 8. Detta verktyg innefattar en kombinerare 24 som kombine- rar de kvantiserade felsignalerna É(k) och en predikterad audiosignal i frekvensdomänen X(k) för generering av en rekon- struerad audiosignal X(k) även i frekvensdomänen. Filterbanken 9 omvandlar den rekonstruerade signalen X(k) från frekvens- domänen till tidsdomänen för att generera en rekonstruerad tidsdomänaudiosignal 2 ill e Denna signal återkopplas i sin tur t långsiktigt predikteringsverktyg som även mottar Ü Ü 4..__.._'... ..._1..._._.C.C.' ___' _'I.4_ LCLLL bh LLLLL ....1_-.-.. -n n-4_ 1.°....,...__: 1-.1_.'...~ .,..,_,_,.1 ...-: ._ ut-:ina n. UCL, langalntlga piculntcilïïgö- (D .-._41 1.
LCLLLL Ti G verktyget 26 genererar en predikterad aktuell tidsram från föregående rekonstruerade tidramar med användande av predikte- ringskoefficienterna för den aktuella ramen. En filterbank 25 transformerar den predikterade signalen 2. 521 129 14 Det inses att prediktorstyrningsinformationen som sänds från kodaren kan användas vid avkodaren för styrning av avkodnings- operationen. Särskilt kan prediktor_använd-bitarna användas i kombineraren 24 för att bestämma huruvida prediktering har använts eller ej i varje givet frekvensband.
I fig. 5 visas en alternativ implementering av audiosignalkoda- ren i fig. 1, vid vilken en audiosignal x som skall kodas jäm- förs med den predikterade signalen 2 i tiddomänen av en kompa- rator 15 för att generera en felsignal e, även detta i tid- domänen. Därefter transformerar ett filterbankverktyg 16 fel- signalen från tiddomänen till frekvensdomänen för att generera en uppsättning frekvensdelbandfelsignaler E(k). Därefter kvan- tiseras dessa signaler av en kvantiserare 17 för att generera en uppsättning kvantiserade felsignaler É(k).
Därefter används en andra filterbank 18 för att omvandla de kvantiserade felsignalerna É(k) tillbaka till tiddomänen, vilket resulterar i en signal ë. Denna kvantiserade felsignal i tiddomänen ë kombineras därefter vid en signalbehandlings- enhet 19 med den predikterade audiosignalen i tiddomänen 2 för att generera en kvantiserad audiosignal X. Ett predikte- ringsverktyg 20 utför samma funktion som verktyget 12 hos kodaren i fig. 3, genererande den predikterade audiosignalen 2 och predikteringskoefficieterna A. Predikteringskoefficienterna och de kvantiserade felsignalerna kombineras vid en bitström- multiplexor 21 för överföring över överföringskanalen 22. Såsom beskrivits ovan kvantiseras felsignalerna i enlighet med en psyko-akustisk modell medelst en styrenhet 23.
De ovan beskrivna audiokodningsalgoritmerna möjliggör komprime- ring av audiosignaler vid låga bithastigheter. Denna teknik baseras på långsiktig prediktering (LT-prediktering). Jämfört med de kända bakåtriktade adaptiva predikteringsteknikerna ger de här beskrivna teknikerna högre predikteringsförbättringar för musiksignaler med ett instrument och talsignaler samtidigt som de endast kräver liten beräkningskomplexitet.
Claims (8)
1. Sätt att koda en audiosignal, vilket sätt innefattar följande steg: att man mottar en audiosignal x som skall kodas; att man genererar en kvantiserad audiosignal X från den mottagna audiosignalen x; att man genererar en uppsättning långsiktiga predikte- ringskoefficienter A som kan användas för att prediktera en aktuell tidsram hos den mottagna audiosignalen direkt från åtminstone en föregående tidsram hos den kvantiserade audio- signalen 2; att man använder predikteringskoefficienterna A för att generera en predikterad audiosignal 2; att man jämför den mottagna audiosignalen x med den predikterade audiosignalen 2 och genererar en felsignal E(k) för vart och ett av ett flertal frekvensdelband; att man kvantiserar felsignalerna E(k) för att generera en uppsättning kvantiserade felsignaler É(k); och att man kombinerar de kvantiserade felsignalerna É(k) och predikteringskoefficienterna A för att generera en kodad audiosignal.
2. Sätt enligt patentkrav l innefattande att man trans- formerar den mottagna audiosignalen x i ramar xm från tiddomä- nen till frekvensdomänen för att åstadkomma en uppsättning frekvensdelbandsignaler X(k) och transformerar den predikterade audiosignalen 2 från tiddomänen till frekvensdomänen för att generera en uppsättning predikterade frekvensdelbandsignaler É(k), varvid jämförelsen mellan den mottagna audiosignalen x och den predikterade audiosignalen 2 utförs i frekvensdomänen, och respektive delbandsignaler jämfö Ur »l + v « w qnnlv-fi FÅ att mA v LLLCKJ. VOLGLLKALO. .LkJL G generera frekvensdelbandfe signaler E(k).
3. Sätt enligt patentkrav 1, innefattande att man utför jämförelsen mellan den mottagna audiosignalen x och den predik- » ~ . , . f 521 129 16 terade audiosignalen 2 i tiddomänen för att generera en fel- signal e som också ligger i tiddomänen och omvandlar felsigna- len e från tid- till frekvensdomänen för att generera nämnda flertal frekvensdelbandfelsignaler E(k).
4. Sätt att avkoda en kodad audiosignal, vilket sätt inne- fattar följande steg: att man mottar en kodad audiosignal innefattande en kvantiserad felsignal É(k) för vart och ett av ett flertal frekvensdelband hos audiosignalen och, för varje tidsram av audiosignalen, en uppsättning predikteringskoefficienter A som kan användas för att prediktera en aktuell tidram xm hos den mottagna audiosignalen direkt från åtminstone en föregående tidram hos en rekonstruerad, kvantiserad audiosignal 2; att man genererar nämnda rekonstruerade, kvantiserade audiosignal 2 utifrån de kvantiserade felsignalerna É(k); att man använder predikteringskoefficienterna A och den kvantiserade audiosignalen 2 för att generera en predikterad audiosignal 2; att man transformerar den predikterade audiosignalen 2 från tiddomänen till frekvensdomänen för att generera en upp- sättning predikterade frekvensdelbandsignaler X(k) för kombi- nering med de kvantiserade felsignalerna É(k) för att generera en uppsättning rekonstruerade frekvensdelbandsignaler X(k); och att man utför en frekvens- till tiddomäntransform på de rekonstruerade frekvensdelbandsignalerna X(k) för att generera den rekonstruerade, kvantiserade audiosignalen 2.
5. Anordning för kodning av en audiosignal, vilken anord- ning innefattar: en ingång för mottagning av en audiosignal x som skall kodas; ett behandlingsorgan (2, 3; 15-19) kopplat till nämnda ingång för generering utifrån den mottagna audiosignalen x av en kvantiserad audiosignal 2; 521 129 17 ett predikteringsorgan (l2; 19) kopplat till nämnda behandlingsorgan (3) för generering av en uppsättning lång- siktiga predikteringskoefficienter A för prediktering av en aktuell tidram xm hos den mottagna audiosignalen x direkt från åtminstone en tidigare tidram hos den kvantiserade audiosigna- len 2; ett genereringsorgan (10-14; 20, 15) för generering av en predikterad audiosignal 2 med användande av predikterings- koefficienterna A och för jämförande av den mottagna audio- signalen x med den predikterade audiosignalen 2 för att gene- rera en felsignal E(k) för var och en av ett flertal frekvens- delband; ett kvantiseringsorgan (3; 17) för kvantisering av fel- signalerna E(k) för att generera en uppsättning kvantiserade felsignaler É(k); och ett kombineringsorgan (5; 21) för kombinering av de kvantiserade felsignalerna É(k) med predikteringskoefficien- terna A för att generera en kodad audiosignal.
6. Anordning enligt patentkrav 5, vid vilken nämnda gene- reringsorgan innefattar ett första transformorgan (11) för transformering av den mottagna audiosignalen x från tid- till frekvensdomänen och ett andra transformorgan (13) för trans- formering av den predikterade audiosignalen 2 från tid- till frekvensdomänen, och ett jämförelseorgan (14) inrättat att jämföra de resulterande frekvensdomänsignalerna i frekvens- domänen.
7. Anordning enligt patentkrav 6, vid vilken genererings- organet är inrättat att jämföra den mottagna audiosignalen x och den predikterade audiosignalen 2 i tiddomänen.
8. Anordning för avkodning av en kodad audiosignal x, där den kodade audiosignalen innefattar en kvantiserad felsignal É(k) för var och en av ett flertal frekvensdelband hos audio- signalen och en uppsättning predikteringskoefficienter A för varje tidram hos audiosignalen och predikteringskoefficienterna A kan användas för att prediktera en aktuell tidram xn hos den , , . . _, 521 129 18 mottagna audiosignalen direkt från åtminstone en tidigare tid- ram hos en rekonstruerad, kvantiserad audiosignal 2, vilken anordning innefattar: en ingång för mottagning av den kodade audiosignalen; ett genereringsorgan (24, 25, 9) för generering av nämnda rekonstruerade, kvantiserade audiosignal 2 utifrån de kvantiserade felsignalerna É(k); och ett signalbehandlingsorgan (26) för generering av en predikterad audiosignal 2 utifrån predikteringskoefficienterna A och nämnda rekonstruerade audiosignal X, varvid nämnda genereringsorgan innefattar ett första transformeringsorgan (25) för transformering av den predikte- rade audiosignalen 2 från tiddomänen till frekvensdomänen för att generera en uppsättning predikterade frekvensdelband- signaler É(k), ett kombineringsorgan (24) för kombinering av nämnda uppsättning predikterade frekvensdelbandsignaler É(k) med de kvantiserade felsignalerna É(k) för att generera en uppsättning rekonstruerade frekvensdelbandsignaler X(k), och ett andra transformeringsorgan (9) för utförande av en frekvens- till tiddomäntransform på de rekonstruerade frek- vensdelbandsignalerna X(k) för generering av den rekonstrue- rade, kvantiserade audiosignalen 2.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI971108A FI114248B (sv) | 1997-03-14 | 1997-03-14 | Förfarande och anordning för audiokodning och audioavkodning |
Publications (3)
Publication Number | Publication Date |
---|---|
SE9800776D0 SE9800776D0 (sv) | 1998-03-10 |
SE9800776L SE9800776L (sv) | 1998-09-15 |
SE521129C2 true SE521129C2 (sv) | 2003-09-30 |
Family
ID=8548401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SE9800776A SE521129C2 (sv) | 1997-03-14 | 1998-03-10 | Sätt och anordning för audiokodning |
Country Status (13)
Country | Link |
---|---|
US (2) | US6721700B1 (sv) |
EP (1) | EP0966793B1 (sv) |
JP (2) | JP3391686B2 (sv) |
KR (1) | KR100469002B1 (sv) |
CN (1) | CN1135721C (sv) |
AU (1) | AU733156B2 (sv) |
DE (1) | DE19811039B4 (sv) |
ES (1) | ES2164414T3 (sv) |
FI (1) | FI114248B (sv) |
FR (1) | FR2761801B1 (sv) |
GB (1) | GB2323759B (sv) |
SE (1) | SE521129C2 (sv) |
WO (1) | WO1998042083A1 (sv) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2380640A (en) * | 2001-08-21 | 2003-04-09 | Micron Technology Inc | Data compression method |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7016547B1 (en) | 2002-06-28 | 2006-03-21 | Microsoft Corporation | Adaptive entropy encoding/decoding for screen capture content |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
ES2334934T3 (es) | 2002-09-04 | 2010-03-17 | Microsoft Corporation | Codificacion de entropia por adaptacion de codificacion entre modalidades de nivel y de longitud de sucesion y nivel. |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
KR100524065B1 (ko) * | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
TWI220753B (en) * | 2003-01-20 | 2004-09-01 | Mediatek Inc | Method for determining quantization parameters |
US7782954B2 (en) | 2003-09-07 | 2010-08-24 | Microsoft Corporation | Scan patterns for progressive video content |
US7688894B2 (en) | 2003-09-07 | 2010-03-30 | Microsoft Corporation | Scan patterns for interlaced video content |
US7724827B2 (en) | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
WO2005034092A2 (en) * | 2003-09-29 | 2005-04-14 | Handheld Entertainment, Inc. | Method and apparatus for coding information |
TWI227866B (en) * | 2003-11-07 | 2005-02-11 | Mediatek Inc | Subband analysis/synthesis filtering method |
US7933767B2 (en) * | 2004-12-27 | 2011-04-26 | Nokia Corporation | Systems and methods for determining pitch lag for a current frame of information |
EP2290824B1 (en) * | 2005-01-12 | 2012-05-23 | Nippon Telegraph And Telephone Corporation | Long term prediction coding and decoding method, devices thereof, program thereof, and recording medium |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7693709B2 (en) | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7684981B2 (en) | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7933337B2 (en) | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
US8599925B2 (en) | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
GB2436192B (en) * | 2006-03-14 | 2008-03-05 | Motorola Inc | Speech communication unit integrated circuit and method therefor |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
RU2464650C2 (ru) * | 2006-12-13 | 2012-10-20 | Панасоник Корпорэйшн | Устройство и способ кодирования, устройство и способ декодирования |
US8184710B2 (en) | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
US20100292986A1 (en) * | 2007-03-16 | 2010-11-18 | Nokia Corporation | encoder |
US7774205B2 (en) | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
CN101075436B (zh) * | 2007-06-26 | 2011-07-13 | 北京中星微电子有限公司 | 带补偿的音频编、解码方法及装置 |
US20090048827A1 (en) * | 2007-08-17 | 2009-02-19 | Manoj Kumar | Method and system for audio frame estimation |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
WO2009132662A1 (en) * | 2008-04-28 | 2009-11-05 | Nokia Corporation | Encoding/decoding for improved frequency response |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
KR20090122143A (ko) * | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
CN104240713A (zh) * | 2008-09-18 | 2014-12-24 | 韩国电子通信研究院 | 编码方法和解码方法 |
WO2010091554A1 (zh) * | 2009-02-13 | 2010-08-19 | 华为技术有限公司 | 一种基音周期检测方法和装置 |
DE102010006573B4 (de) * | 2010-02-02 | 2012-03-15 | Rohde & Schwarz Gmbh & Co. Kg | IQ-Datenkompression für Breitbandanwendungen |
CA3054712C (en) | 2013-01-08 | 2020-06-09 | Lars Villemoes | Model based prediction in a critically sampled filterbank |
WO2018101868A1 (en) * | 2016-12-02 | 2018-06-07 | Dirac Research Ab | Processing of an audio input signal |
CN112564713B (zh) * | 2020-11-30 | 2023-09-19 | 福州大学 | 高效率低时延的动觉信号编解码器及编解码方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5921039B2 (ja) | 1981-11-04 | 1984-05-17 | 日本電信電話株式会社 | 適応予測符号化方式 |
US4969192A (en) | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
GB8803390D0 (en) | 1988-02-13 | 1988-03-16 | Univ Belfast | Method and apparatus for electrical signal coding |
FR2628589B1 (fr) * | 1988-03-14 | 1994-03-04 | Etat Francais | Codeur differentiel a filtre predicteur auto-adaptatif et decodeur utilisable en liaison avec un tel codeur |
EP0364647B1 (en) * | 1988-10-19 | 1995-02-22 | International Business Machines Corporation | Improvement to vector quantizing coder |
IT1232084B (it) * | 1989-05-03 | 1992-01-23 | Cselt Centro Studi Lab Telecom | Sistema di codifica per segnali audio a banda allargata |
FR2646978B1 (fr) | 1989-05-11 | 1991-08-23 | France Etat | Procede et installation a codage de signaux sonores |
US5115240A (en) * | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
JPH04119542A (ja) * | 1990-09-07 | 1992-04-21 | Nikon Corp | 光磁気記録媒体カートリッジ |
US5206884A (en) | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
FI95085C (sv) | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | En metod för digital kodning av en talsignal samt talkoder för utförande av förfarandet |
FI91345C (sv) | 1992-06-24 | 1994-06-10 | Nokia Mobile Phones Ltd | Förfarande för att effektivera kanalväxling |
GB2282943B (en) * | 1993-03-26 | 1998-06-03 | Motorola Inc | Vector quantizer method and apparatus |
IT1270438B (it) * | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
FI98163C (sv) * | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Kodningssystem för parametrisk talkodning |
EP0709981B1 (en) * | 1994-10-28 | 2002-01-09 | RAI RADIOTELEVISIONE ITALIANA (S.p.A.) | Subband coding with pitchband predictive coding in each subband |
DK0799531T3 (da) * | 1994-12-20 | 2000-07-10 | Dolby Lab Licensing Corp | Fremgangsmådeapparat til at anvende bølgeformsforudsigelse til underbånd af et kodningssystem, der vedrører sanseopfattelse |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
TW321810B (sv) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP3481027B2 (ja) * | 1995-12-18 | 2003-12-22 | 沖電気工業株式会社 | 音声符号化装置 |
US5778335A (en) * | 1996-02-26 | 1998-07-07 | The Regents Of The University Of California | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding |
FI964975A (sv) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Förfarande och anordning för talkodning |
-
1997
- 1997-03-14 FI FI971108A patent/FI114248B/sv not_active IP Right Cessation
-
1998
- 1998-02-18 WO PCT/FI1998/000146 patent/WO1998042083A1/en active IP Right Grant
- 1998-02-18 ES ES98904191T patent/ES2164414T3/es not_active Expired - Lifetime
- 1998-02-18 EP EP98904191A patent/EP0966793B1/en not_active Expired - Lifetime
- 1998-02-18 KR KR10-1999-7008369A patent/KR100469002B1/ko not_active IP Right Cessation
- 1998-02-18 AU AU62164/98A patent/AU733156B2/en not_active Expired
- 1998-03-06 US US09/036,102 patent/US6721700B1/en not_active Expired - Lifetime
- 1998-03-10 SE SE9800776A patent/SE521129C2/sv not_active IP Right Cessation
- 1998-03-12 GB GB9805294A patent/GB2323759B/en not_active Expired - Lifetime
- 1998-03-13 CN CNB981041809A patent/CN1135721C/zh not_active Expired - Lifetime
- 1998-03-13 FR FR9803135A patent/FR2761801B1/fr not_active Expired - Lifetime
- 1998-03-13 DE DE19811039A patent/DE19811039B4/de not_active Expired - Lifetime
- 1998-03-13 JP JP06351498A patent/JP3391686B2/ja not_active Expired - Lifetime
-
2002
- 2002-10-07 JP JP2002293702A patent/JP2003140697A/ja active Pending
-
2003
- 2003-11-07 US US10/704,068 patent/US7194407B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
FI971108A (sv) | 1998-09-15 |
WO1998042083A1 (en) | 1998-09-24 |
GB9805294D0 (en) | 1998-05-06 |
SE9800776D0 (sv) | 1998-03-10 |
JP3391686B2 (ja) | 2003-03-31 |
KR100469002B1 (ko) | 2005-01-29 |
CN1195930A (zh) | 1998-10-14 |
SE9800776L (sv) | 1998-09-15 |
AU6216498A (en) | 1998-10-12 |
FR2761801A1 (fr) | 1998-10-09 |
DE19811039B4 (de) | 2005-07-21 |
DE19811039A1 (de) | 1998-09-17 |
FI971108A0 (sv) | 1997-03-14 |
JP2003140697A (ja) | 2003-05-16 |
GB2323759B (en) | 2002-01-16 |
JPH10282999A (ja) | 1998-10-23 |
AU733156B2 (en) | 2001-05-10 |
EP0966793B1 (en) | 2001-09-19 |
CN1135721C (zh) | 2004-01-21 |
US6721700B1 (en) | 2004-04-13 |
EP0966793A1 (en) | 1999-12-29 |
US7194407B2 (en) | 2007-03-20 |
ES2164414T3 (es) | 2002-02-16 |
US20040093208A1 (en) | 2004-05-13 |
GB2323759A (en) | 1998-09-30 |
FI114248B (sv) | 2004-09-15 |
KR20000076273A (ko) | 2000-12-26 |
FR2761801B1 (fr) | 1999-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
SE521129C2 (sv) | Sätt och anordning för audiokodning | |
EP2947652B1 (en) | Decoding of a stereo audio signal using complex prediction | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
KR100304092B1 (ko) | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 | |
JP4081447B2 (ja) | 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法 | |
JP5324450B2 (ja) | 音声信号の符号変換のための方法及び装置 | |
WO2008072670A1 (ja) | 符号化装置、復号装置、およびこれらの方法 | |
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JPH11143499A (ja) | 切替え型予測量子化の改良された方法 | |
WO2014096236A2 (en) | Signal adaptive fir/iir predictors for minimizing entropy | |
JP2000338998A (ja) | オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体 | |
JPH0341500A (ja) | 低遅延低ビツトレート音声コーダ | |
JP2006145782A (ja) | オーディオ信号符号化装置および方法 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
KR19980080742A (ko) | 신호 부호화방법 및 장치 | |
Muin et al. | A review of lossless audio compression standards and algorithms | |
JP2010256932A (ja) | 音声信号標本値の符号化または復号化のための方法並びに符号化器ないし復号化器 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
JPS62224122A (ja) | 信号符号化方法 | |
JPH08137494A (ja) | 音響信号符号化装置、音響信号復号装置および音響信号処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
NUG | Patent has lapsed |