SE517793C2 - Sätt att åstadkomma ett spektralbrusviktningsfilter att använda i en talkodare - Google Patents

Sätt att åstadkomma ett spektralbrusviktningsfilter att använda i en talkodare

Info

Publication number
SE517793C2
SE517793C2 SE9403630A SE9403630A SE517793C2 SE 517793 C2 SE517793 C2 SE 517793C2 SE 9403630 A SE9403630 A SE 9403630A SE 9403630 A SE9403630 A SE 9403630A SE 517793 C2 SE517793 C2 SE 517793C2
Authority
SE
Sweden
Prior art keywords
filter
coefficients
order
generating
spectral noise
Prior art date
Application number
SE9403630A
Other languages
English (en)
Other versions
SE9403630D0 (sv
SE9403630L (sv
Inventor
Ira A Gerson
Mark A Jasiuk
Matthew A Hartman
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of SE9403630D0 publication Critical patent/SE9403630D0/sv
Publication of SE9403630L publication Critical patent/SE9403630L/sv
Publication of SE517793C2 publication Critical patent/SE517793C2/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

lO 517 793 rametrarna innefattar typiskt sett koefficienter för långtids-, korttids- och spektralbrusviktningsfilterna.
Filtreringsoperationerna som beror av ett spektral- brusviktningsfilter kan utgöra en betydande del av en eftersom en kodvek- Sett erbjuds talkodares totala beräkningskomplexitet, spektralviktad felsignal måste beräknas för varje tor ur en kodbok av innovationssekvenser. Typiskt behöver nog en kompromiss mellan den styrning som av och den komplexitet som uppkommer pga spektralbrus- viktningsfiltret.øåäyteknik som skulle medge en ökad styrning av den frekvensformning som införs av spektral- brusviktningsfiltret, utan någon motsvarande ökning av viktningsfilterkomplexiteten, skulle vara en användbar utveckling av den kända tekniken för talkodning.
Kort beskrivning av ritningarna Pig l är ett blockschema över en talkodare i vilken föreliggande uppfinning kan utnyttjas.
Fig 2 är ett processflödesschema som åskådliggör en generell frekvens av talkodningsoperationer vilka förs i enlighet med en utföringsform av föreliggande uppfinning.
Fig 3 är ett processflödesschema som åskådliggör en frekvens för alstring av kombinerade spektralbrusfilter- koefficienter i enlighet med föreliggande uppfinning.
Fig 4 är ett blockschema över en utföringsform av en talkodare enligt föreliggande uppfinning.
Fig 5 är ett processflödesschema som åskådliggör en generell frekvens av talkodningsoperationer vilka utförs i enlighet med en utföringsform av föreliggande uppfin- ning.
Fig 6 är ett blockschema över spektralbrusviktnings- filterkonfigurationer i enlighet med föreliggande uppfin- ning.
Fig 7 är ett blockschema över spektralbrusviktnings- filterkonfigurationer enligt föreliggande uppfinning. 511793' “ .. nu UU 0000 0000 I QIOQ IDO! Iludflø Detaljerad beskrivning av en föredragen utförings- m Denna beskrivning omfattar ett sätt att utföra digi- tal talkodning. Detta sätt innefattar modellering av frekvenssvaret hos flera filter med ett filter av Rzte kodningen, för att därigenom åstadkomma ett filter som erbjuder samma styrning som flera filter utan komplexite- ten hos flera filter. Filtret av ordning R kan användas som ett spektralbrusviktningsfilter eller en kombination av ett korttidsprediktorfilter och ett spektralbrusvikt- ningsfilter, beroende på vilken utföringsform som utnytt- jas. Kombinationen av korttidsprediktorfiltret och spekt- ralbrusviktningsfiltret benämnes det spektralbrusviktade syntesfiltret. Enligt sättet modelleras i allmänhet frek- venssvaret för L P:te ordningens filter med ett enda Rzte där R formen är L lika med 2. Följande ekvation åskådliggör ordningens filter, I den föredragna utförings- sättet som utnyttjas i föreliggande uppfinning. 1 April. ,...A(.=.)-___P1__ AF] 013 än 1-_2_a_iz-i 1-fiaiaíi1z-i |=1 5:1 och 12a22a32O Fig 1 är ett blockschema över en första utförings- form av en talkodare som nyttjar föreliggande uppfinning.
En akustisk insignal som skall analyseras matas till tal- kodaren 100 via en mikrofon 102. Insignalen, som typiskt sett är en talsignal, matas därefter till ett filter 104.
Filtret skaper. filtret En analog-till-digitalomvandlare 104 uppvisar generellt sett bandpassfilteregen- Om emellertid talbandbredden redan är adekvat kan 104 innefatta en direkt trådförbindelse.
(A/D)-omvandlare 108 omvandlar den analoga talsignalen 152 som utmatas från filtret 104 till en sekvens av N pulssampel, varvid amplituden hos varje pulssampel representeras av en digi- 517 793 4 .. tal kod, klocka SC bestämmer A/D-omvandlarens 108 samplingsfrek- vilket är känt inom teknikområdet. En sampel- vens. 8 kHz. Sampelklockan SC alstras tillsammans med en ram- klocka FC i en klockmodul 112.
Den digitala utsignalen från A/D 108, vilken benäm- I den föredragna utföringsformen går klockan SC med nes intalvektor, s(n) 158 matas till koefficientanalysa- torn~110. benna intalvektor s(n) 158 erhålls repetitivt i separata ramar, dvs tidslängder, vars längd bestäms av ramklockan FC.
För varje block av tal produceras en uppsättning (LPC) entanalysatorn 110. Korttidsprediktorkoefficienterna 160 (STP), (LTP) excitationsförstärkningsfaktor 166 g matas till en multi- linjära, prediktiva kodningsparametrar av koeffici- långstidsprediktorkoefficienterna 162 och en plexor 150 och sänds över kanalen för att användas av 158 matas också till vars funktion kommer att beskrivas talsyntetisatorn. Intalvektorn s(n) en subtraherare 130, nedan.
Ett grundläggande vektorminnesblock 114 innehåller en uppsättning av M basvektorer Vm(n), där 1 š m á M, vilka var och en består av N sampel, där 1 < n 5 N. Dessa basvektorer används av en kodboksgenerator 120 för att alstra en uppsättning av två 2M pseudo-slumpmässiga exci- M tationsvektorer ui(n), där O š i š 2 -1. Var och en av de M basvektorerna utgörs av en följd av slumpmässiga, Gaussiska sampel, även om andra typer av basvektorer kan användas.
Kodboksgeneratorn 120 utnyttjar de M basvektorerna Vm(n) och en uppsättning av ZM excitationskodord Ii, där M 0 -1, för att alstra de 2M excitationsvektorerna II/\ i § 2 ui(n). I föreliggande utföringsform är varje kodord Ii lika med sitt index i, dvs Ii=i. Om excitationssignalen vore kodad med frekvensen 0,25 bitar per sampel för vart och ett av de 40 samplen (så att M=10) så skulle 10 bas- 000000 000000 517 793' ' .. ._ OIQO vektorer användas för att alstra de 1024 excitationsvek- torerna.
För varje enskild excitationsvektor ui(n) alstras en rekonstruerad talvektor s'i(n) för jämförelse med intal- vektorn s(n). Ett förstärkarblock 122 skalar excita- tionsvektorn ui(n) med excitationsförstärkningsfaktorn gi, signalen giui(n) diktorfiltret 124 och korttidsprediktorfiltret 126 för 170.
Långtidsprediktorfiltret 124 utnyttjar làngtidsprediktor- som är konstant för ramen. Den skalade excitations- 168 filtreras därefter av làngtidspre- att alstra den rekonstruerade talvektorn s'i(n) koeffiecienterna 162 för att införa talperiodicitet och korttidsprediktorfiltret 126 utnyttjar korttidskoeffici- enterna 160 för att införa spektralenveloppen. Notera att blocken 124 och 126 i själva verket är rekursiva filter, vilka innehåller långtidsprediktorn och korttidspredik- torn i sina respektive återkopplingsvägar. Den rekon- struerade talvektorn s'i(n) 170 för den Izte excita- tionskodvektorn jämförs med samma block av intalvektorn s(n) 158 genom subtraktion av dessa två signaler i sub- traheraren 130. Differensvektorn ei(n) 172 representerar differensen mellan de ursprungliga och de rekonstruerade talblocken. 172 viktas med hjälp av spektralbrusviktningsfiltret 132, med utnyttjande av Differensvektorn ei(n) spektralbrusviktningsfiltrets koefficienter 164 som alst- ras av koefficientanalysatorn 110. Spektralbrusviktning accentuerar frekvenser där felet är mer perceptuellt vik- tigt för det mänskliga Qtt mer effektivt sätt örat och dämpar andra frekvenser. jatt utföra spektralbrusviktningen fär sättet enligt denna uppfinning.
En energikalkylator 134 beräknar den spektral- brusviktade differensvektorns e'¿(n) 174 energi och matar denna felsignal Ei 176 till en styrenhet för kodbokssök- ning 140. Styrenheten för kodbokssökning 140 jämför den izte felsignalen för den föreliggande excitationsvektorn ui(n) med tidigare felsignaler för att bestämma excita- tionsvektorn som alstrar det minsta viktade felet. Koden Iulnvt 517 793' .. 6.. för den izte excitationsvektorn som har ett minsta fel utmatas därefter på kanalen som den bästa excitationsko- 178. bestämma ett visst kodord som ger en felsignal som har den I Såsom ett alternativ kan sökstyrenheten 140 något förutbestämt kriterium, såsom att den uppfyller en i förväg definierad feltröskel. ' Fig 2 innehåller ett processflödesschema 200, som åskådliggör den generella sekvensen av talkodningsopera- tioner som utförs i enlighet med den första utföringsfor- Proces- Funktionsblock 203 mottar taldata i Funktionsblock 205 bestämmer korttids- och långtidsprediktorkoeffiecien- men av föreliggande uppfinning som visas i fig 1. sen börjar vid 201. enlighet med beskrivningen i fig 1. terna. Detta utförs i koefficientanalysatorn 110 i fig 1.
Sätt att bestämma korttids- och làngtidsprediktorkoeffi- cienterna finns i en artikel med titeln "Predictive Coding of Speech at Low Bit Rates" IEEE Trans. Commun. vol Com-30, sid 600-14, april 1982, av B.S. Atal. Kort- tidsprediktorn A(z) definieras av koefficienterna i ekva- tionen 1 A(z) = :Pi- 1-2aiz* i=1 Funktionsblock 207 alstrar en uppsättning mellanlig- gande spektralbrusviktningsfilterkoefficienter som ka- ratäriserar åtminstone en första och en andra filterupp- sättning. Filtrerna kan vara filter av vilken som helst ordning, exempelvis är det första filtret av ordning F och det andra filtret av ordning J, där R < F + J. Den föredragna utföringsformen brukar två filter av ordning J, där J är lika med P, Filterna som använder dessa koef- ficienter är på formen 517 7935 .. +/-\|(z)= 1 ALZLJ/qzzš] där 12012201320.
/\ H(z>, andra uppsättning filter av ordning J, definieras som ett som är en kaskad av åtminstone en första och en mellanliggande spektralbrusviktningsfilter. Notera att koefficienterna i det mellanliggande spektralbrusvikt- ningsfiltret är beroende av korttidsprediktorkoefficien- terna som alstras i funktionsblock 205. Å H(2>, använts direkt i talkodarimplementeringar.
Detta mellanlig- gande spektralbrusviktningsfilter, har tidigare För att reducera beräkningskomplexiteten pga spekt- ralbrusviktningen modelleras frekvenssvaret för â(z) med ett enkelt, Rzte ordningens filter HS(Z), som är det kombinerade spektralbrusviktningsfiltret, pà formen: ^ 1 f¶s(2)='“'ï§--- 1-gäiz-1 i=1 Notera att även om HS(Z) visas som ett polfilter kan Å Hs(Z) också utformas som ett nollfilter. Funktionsblock 209 alstrar koefficienterna för filtret âS(Z). Processen att alstra koefficienterna för det kombinerade spektral- brusviktningsfiltret àskådliggörs i detalj i fig 3. Note- ra att all-polsmodellen av ordning R har lägre ordning än det mellanliggande spektralbrusviktningsfiltret, vilket leder till beräkningsmässiga besparingar.
Funktionsblock 211 åstadkommer excitationsvektorer som gensvar på mottagning av taldata i enlighet med be- skrivningen av fig l. Funktionsblock 213 filtrerar exci- tationsvektorerna genom långtidsprediktorfiltret 224 och korttidsprediktorfiltret 226.
Funktionsblock 215 jämför de filtrerade excita- tionsvektorerna som utmatas från funktionsblocket 213 och l0 bildar i enlighet med beskrivningen av fig 1 en diffe- Funktionsblock 217 filtrerar med utnyttjande av koefficienterna rensvektor. differensvek- torn, för det kombine- koeffiecienter att bilda en Funktionsblock 219 beräknar energin i den spektralbrusviktade differensvek- vilka har alstrats i funktionsblocket 209, rade spektralbrusviktningsfiltret, för spektralbrusviktad differensvektor. torn i enlighet med beskrivningen av fig l, och bildar en felsignal. Funktionsblock 221 väljer en excitationskod, I, med utnyttjande av felsignalen i enlighet med beskriv- ningen av fig l. Processen slutar i 223.
Fig 3 åskådliggör processflödesschemat 300, som be- skriver detaljer som kan utnyttjas vid implementering av funktionsblocket 209 i fig 2. Processen börjar vid 301.
Givet det mellanliggande spektralbrusviktningsfiltret ñ(z) A alstrar funktionsblock 303 ett pulssvar, h(n), av Û(z) för K sampel, där A H(Z)= Aíi] 1 A[¿:| där 0SocnS1, A(-z-)=--í1-- och al G3 an P _ _ 02 Ljaialilz-l |=1 det finns åtminstone två icke-kansellerande termer; dvs al#a2 med al>O och a2>O, eller a2#a3 med a2>0 och a3>0.
Funktionsblock 305 autokorrelerar pulssvaret h(n) och bildar därvid en autokorrelation på formen K-iA A Rhhu) = ghfiflhçni), os i s R; R< K n-1 Funktionsblock 307 beräknar, med utnyttjande av autokor- relationen och Levinsons rekursion, koefficiententerna för ñs(z), som är det kombinerade spektralbrusviktnings- filtret, på formen: '30 517 793* I .. :www o ^ 1 HSÛFRm 1-2äfl4 i=1 Fig 4 är ett generiskt blockschema över en andra ut- föringsform av en talkodare i enlighet med föreliggande uppfinning. Talkodaren 400 är likadan som talkodaren 100 med undantag för de skillnader som förklaras nedan. Först ersätts spektralbrusviktningsfiltret 132 i fig 1 med två filter som föregår subtraheraren 430 i fig 4. Dessa två filter är ett spektralbrusviktat syntesfilter 1 468 och ett spektralbrusviktat syntesfilter 2 426. I det följande Filter 1 468 och filter 2 426 skiljer sig från spektralbrusviktningsfilt- benämnes dessa filter 1 och filter 2. ret 132 i fig 1 på så sätt att vart och ett innefattar ett korttidssyntesfilter eller viktat korttidssyntes- filter förutom ett spektralbrusviktningsfilter. Det re- sulterande filtret benämnes generiskt ett spektral- brusviktat syntesfilter. I synnerhet kan detta implemen- teras som ett mellanliggande, spektralbrusviktat syntes- filter eller som ett kombinerat, tesfilter. ter 470. Vidare har korttidsprediktorn 126 i fig 1 elimi- spektralbrusviktat syn- Filter 1 468 föregås av ett korttidsinversfil- nerats i fig 4. Filter 1 och filter 2 är identiska med undantag för deras respektive placeringar i fig 4. Två specifika konfigurationer av dessa filter åskådliggörs i fig 6 och fig 7.
En koefficientanalysator 410 alstrar korttidspredik- filter 1-koefficienter 460, filter làngtidsprediktorkoefficienter 464 Sättet att torkoefficienter 458, 2-koefficienter 462, och en excitationsförstärkningsfaktor g 466. alstra koefficienterna för filter 1 och filter 2 åskåd- liggöres i fig 5. Talkodaren 400 kan alstra samma resul- tat som talkodaren 100 under det att den potentiellt re- Således kan tal- Be- ducerar antalet nödvändiga beräkningar. kodaren 400 vara att föredra framför talkodaren 100. 00000! 517 17956 .W skrivningen av de funktionsblock som är identiska i tal- kodaren 100 och talkodaren 400 kommer inte att upprepas av effektivitetsskäl.
Fig 5 är ett processflödesschema som åskådliggör sättet att alstra koefficienterna för HS(z), som är det kombinerade, spektralbrusviktade syntesfiltret. börjar vid 501.
Processen Funktionsblock 503 alstrar koefficienten för ett P:te ordningens korttidsprediktorfilter A(z).
Funktionsblock 505 alstrar koefficienter för ett mellan- ~ liggande, spektralbrusviktat syntesfilter, H(z), på for- men F1(z)=A i 1 Aíl-l där osansi, A i _ 1 G2 Mïaïxialllz-l |= Med H(z) givet alstrar funktionsblock 509 koefficienter för ett Rzte ordningens kombinerat, spektralbrusviktat syntesfilter, HS(z), som modellerar filtrets H(z) frek- venssvar. Koefficienterna alstras med hjälp av autokorre- ~ »sa h(n), av }í(z) av en rekursionsmetod för att finna koefficienterna. lering av pulssvaret, och med utnyttjande Den föredragna utföringsformen använder Levinsons rekursion, som förutsätts vara känd av fackmannen på området. Pro- cessen slutar vid 511.
Fig 6 och fig 7 visar den första konfigurationen respektive den andra konfigurationen som kan nyttjas i det viktade syntesfilter 1 468 och viktade syntesfiltret 2 426 i fig 4.
I konfiguration 1, fig 6a, innehåller det viktade syntesfilter 2 426 det mellanliggande, spektralbrusvikta- de syntesfiltret H(z), som är en kaskadkoppling av tre filter: korttidssyntesfiltret viktat med al, A(z/al) 611, korttidsinversfiltret viktat med a2, 1/A(z/a2) 613, och korttidssyntesfiltret viktat med a3, A(z/a3) 615, där IOIQOO 517 793* .m 0:a3:a2ša1š1. Det viktade syntesfilter 1 468, fig 6a, är identiskt med det viktade syntesfilter 2 426, med undan- tag för att det föregås av ett korttidsinversfilter l/A-íz) fall en kaskadkoppling av filter 605, ~ H(z) är i detta 607 och 609.
I fig 6b är de mellanliggande, spektralbrusviktade 603 och är placerat i intalvägen. synzesfiltren }{(z) 468 och 426 ersatta av ett enkelt, kombinerat, spektralbrusviktat syntesfilter ñs(z) 619 och 621. ñ5(z) modellerar frekvenssvaret hos ñ(z), som 607 och 609, 613 och 615, Detaljer för alstring av filterkoefficienterna är en kaskadkoppling av filterna 605, eller ekvivalent en kaskadkoppling av filter 611, fig 6a. för ñs(z) återfinns i fig 5.
Konfiguration 2, fig 7a, Det viktade syntesfiltret 2 426 innehåller det mellanliggande, är ett specialfall av kon- figuration 1, där a3=O. sprektralbrusviktade syn- tesfiltret ñS(z), som en kaskadkoppling av två filter: korttidssyntesfiltret viktat med al, A(z/al) 729 och 1/A(z/a2) 731. Det är identiskt med det korttidsinversfiltret viktat med a2, viktade syntesfilter 1 468, viktade syntesfiltret 2 426, med undantag för att det fig 7a, föregås av ett korttidsinversfilter 1/A(z) ~ rat i intalvägen. H(z) av filter 725 och 727.
I fig 7b är det mellanliggande, ~ syntesfiltret }¶S(z) 468 och 426, fig 7a, ersatt av ett 703 och place- är i det fallet en kaskadkoppling spektralbrusviktade enda, kombinerat, spektralbrusviktat syntesfilter H5(z) ~ 719 och 721. HS(z) modellerar frekvenssvaret hos HS(z), som är en kaskadkoppling av filterna 725 och 727, eller ekvivalent en kaskadkoppling av filter 729 och 731, fig ~ 7a. Detaljerna för alstring av koefficienterna av Hs(z) återfinns i fig 5.
Alstring av det kombinerade, spektralbrusviktade filtret från det mellanliggande, spektralbrusviktade filtret på den häri visade formen skapar ett effektivt filter som har styrningen av två eller flera Jzte ord- 517 793' .. ningsfilter med komplexiteten hos ett Rzte ordningens filter. Detta ger ett effektivare filter utan någon mot- svarande ökning av talkodarens komplexitet. Likaledes skapar alstringen av det kombinerade, spektralbrusviktade syntesfiltret från det mellanliggande, spektralbrusvikta- de syntesfiltret på den häri visade formen ett effektivt filter som har styrningen enligt ett Pzte ordningens fil- ter och ett eller flera Jzte ordningens filter kombine- rade i ett Rzte ordningens filter. Detta ger ett effekti- vare filter utan någon motsvarande ökning av talkodarens komplexitet.

Claims (10)

517 793 PATENTKRAV
1. l. Sätt att alstra koefficienter för ett viktnings- filter k ä n n e t e c k n a t av stegen att: alstra koefficienter för ett Pzte ordningens filter; alstra koefficienter för ett mellanliggande filter, innefattande koefficienter för ett första Fzte ordningens filter och ett andra Jzte ordningens filter, varvid varje filter är beroende av koefficienterna för filtret av Pzte 10 15 20 25 30 ordningen; och alstra koefficienter för en Rzte ordningens modell av det mellanliggande filtret för användning i ett vikt- ningsfilter,
2. filter enligt patentkrav 1, där R Sätt att alstra koefficienter för ett viktnings- k ä n n e t e c k n a t aV att steget att alstra en Rzte ordningens modell vidare innefattar stegen att: alstra ett pulssvar för det mellanliggande filtret; autokorrelera pulssvaret och bilda en autokorrela- tion, Rhh(i); och beräkna koefficienterna för filtret av ordning R med användning av en rekursionsmetod och autokorrelationen.
3. filter enligt patentkrav 1, Sätt att alstra koefficienter för ett viktnings- k ä n n e t e c k n a t att rekursionsmetoden är Levinsons rekursionsmetod.
4. spektralbrusviktningsfilter âS(z), med användning av ko- efficienter för ett Pzte ordningens korttidsfilter, A(z), vilket sätt aV Sätt att alstra koefficienter för ett kombinerat k ä n n e t e c k n a s av stegen att: alstra koeffficienter för ett mellanliggande vikt- ningsfilter på formen A _ i _J_ ¿ -- i _ 1 H(z)_A[aJA[¿]A{a3] dar osansi, ALxn _ P _ I G2 1í2ap¿z-I =1 10 15 20 25 30 517 793 och det finns åtminstone två icke-kancellerande termer; alstra ett pulssvar h(n), för det mellanliggande viktningsfiltret â(z), för K sampel; Å autokorrelera pulssvaret, h(n), för att bilda en au- tokorrelation K-iA A Rhhfi) = gn(n)h(n+i), oSaSR; R n-1 beräkna koefficienter för ett kombinerat spektral- /\ brusviktningsfilter, HS(z), på formen íäs(2)= med användning av autokorrelationen, Rhh(i), och en re- kursionsmetod.
5. Sätt enligt patentkrav 4, k ä n n e t e c k - n a t av att rekursionsmetoden är Levinsons rekursions- metod.
6. Sätt att alstra koefficienter för ett kombinerat, spektralbrusviktat syntesfilter, HS(z), med användning av koefficienter för ett Pzte ordningens korttidsfilter, A(z), vilket sätt k ä n n e t e c k n a s av stegen att: alstra koefficienter för ett mellanliggande, spekt- ralbrusviktat syntesfilter på formen H(z)= A[í] 1 ALL] där osansi, A(-Z-)=_-1_- al Aßšfl a3 an P - - Û2 1-28pàZ“| och det finns åtminstone två icke-kancellerande termer: alstra ett pulssvar, h(n), för det mellanliggande, spektralbrusviktade syntesfiltret, H(z), för K sampel; voønuw 10 15 20 25 30 s17'793 autokorrelera pulssvaret, för att bilda en autokorrelation Rhhfi) = §iñ(n)E(n + i), os i S R; R< K,- och (1-1 beräkna (307) koefficienter för ett kombinerat, ~ spektralbrusviktat syntesfilter, H5(z), på formen iäs(Z)= 1 med användning av autokorrelationen Rhh(i) och en rekur- sionsmetod.
7. Sätt att alstra koefficienter för ett spektral- brusviktningsfilter att användas i en talkodare, varvid viktningsfiltret beror på koefficienter i ett Pzte ord- ningens korttidsfilter, vilket sätt k ä n n e t e c k - n a s av stegen att: alstra koefficienter för ett mellanliggande spek- tralbrusviktningsfilter, som har åtminstone tvâ Jzte ord- ningens, icke-kancellerande termer beroende på korttids- filtret av Pzte ordningen; alstra ett pulssvar för det mellanliggande spektral- brusviktningsfiltret för K sampel; autokorrelera pulssvaret för att bilda en autokorre- lation; och bestämma koeffecienter för ett spektralbrusvikt- ningsfilter med användning av autokorrelationen och en rekursionsmetod.
8. Talkodningssätt k ä n n e t e c k n a t av ste- gen att: ta emot taldata; åstadkomma excitationsvektorer som gensvar på steget att ta emot; 000000 nun-vt lO 15 20 25 30 35 517 793 bestämma korttids- och làngtidsprediktorkoefficien- ter att användas i ett långtidsprediktorfilter och ett Pzte ordningens korttidsprediktorfilter; filtrera excitationsvektorerna med utnyttjande av långtidsprediktorfiltret och korttidsprediktorfiltret, för att bilda filtrerade excitationsvektorer; bestämma koefficienter för ett spektralbrusvikt- ningsfilter innefattande stegen att: alstra ett mellanliggande spektralbrusviktningsfil- ter innefattande ett första filter av Fzte ordningen och ett andra filter av Jzte ordning, beroende på koefficien- terna för korttidsfiltret av Pzte ordningen, och alstra spektralbrusviktningskoefficienter med ut- nyttjande av en Rzte ordningens allpolsmodell av det mel- lanliggande spektralbrusviktningsfiltret, där R jämföra de filtrerade excitationsvektorerna med de mottagna taldatana för att bilda en differensvektor; filtrera differensvektorn med utnyttjande av ett filter, som beror av spektralbrusviktningsfilterkoef- ficienterna, för att bilda en filtrerad differensvektor; beräkna energin hos den filtrerade differensvektorn för att bilda en felsignal; och L välja en excitationskod, I, med användning av fel- signalen, som representerar de mottagna taldatana.
9. Talkodningssätt gen att: k ä n n e t e c k n a t av ste- ta emot taldata; åstadkomma excitationsvektorer; alstra filterkoefficienter för ett kombinerat kort- tids- och spektralbrusviktningsfilter innefattande stegen att: alstra ett Pzte ordningen korttidsfilter; alstra ett mellanliggande spektralbrusviktningsfil- ter innefattande ett första filter av Fzte ordningen och ett andra filter av Jzte ordningen, varvid varje filter är beroende av korttidsfiltret av Pzte ordningen, och IOIQIO 10 15 20 25 517 793' C000 Gill oc UIOO IQUIÛ' o u 'P4 .song n n un u: uno: alstra koefficienter för ett Rzte ordningens, all- poligt, kombinerat korttids- och spektralbrusviktnings- filter med utnyttjande av korttidsfiltret av Pzte ord- ningen och det mellanliggande spektralbrusviktningsfilt- ret, där R filtrera de mottagna taldatana; filtrera excitationsvektorerna med utnyttjande av ett làngtidsprediktorfilter och det kombinerade korttids- och spektralbrusviktningsfiltret, för att bilda filtre- rade excitationsvektorer; jämföra de filtrerade excitationsvektorerna med de filtrerade, mottagna taldatana, för att bilda en diffe- rensvektor; beräkna energin hos differensvektorn för att bilda en felsignal; välja, med utnyttjande av felsignalen, en excita- tionskod, I, som representerar de mottagna taldatana.
10. Talkodningssätt enligt patentkrav 9, k ä n - n e t e c k n a t av att steget att alstra koefficienter kombinerat korttids- och spektralbrusviktningsfilter vidare innefattar stegen att: för ett Rzte ordningens, allpoligt, alstra pulssvaret för det mellanliggande spektral- brusviktningsfiltret; autokorrelera pulssvaret, för att bilda en autokor- relation Rhh(i); och beräkna koefficienterna för allpol filtret av Rzte ordningen med utnyttjande av en rekursionsmetod och auto- korrelationen. OOUOIO ø.~..~
SE9403630A 1993-02-23 1994-10-24 Sätt att åstadkomma ett spektralbrusviktningsfilter att använda i en talkodare SE517793C2 (sv)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/021,364 US5434947A (en) 1993-02-23 1993-02-23 Method for generating a spectral noise weighting filter for use in a speech coder
PCT/US1994/000724 WO1994019790A1 (en) 1993-02-23 1994-01-18 Method for generating a spectral noise weighting filter for use in a speech coder

Publications (3)

Publication Number Publication Date
SE9403630D0 SE9403630D0 (sv) 1994-10-24
SE9403630L SE9403630L (sv) 1994-12-21
SE517793C2 true SE517793C2 (sv) 2002-07-16

Family

ID=21803778

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9403630A SE517793C2 (sv) 1993-02-23 1994-10-24 Sätt att åstadkomma ett spektralbrusviktningsfilter att använda i en talkodare

Country Status (11)

Country Link
US (2) US5434947A (sv)
JP (2) JP3070955B2 (sv)
CN (1) CN1074846C (sv)
AU (1) AU669788B2 (sv)
BR (1) BR9404230A (sv)
CA (1) CA2132006C (sv)
DE (2) DE4491015T1 (sv)
FR (1) FR2702075B1 (sv)
GB (1) GB2280828B (sv)
SE (1) SE517793C2 (sv)
WO (1) WO1994019790A1 (sv)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5708756A (en) * 1995-02-24 1998-01-13 Industrial Technology Research Institute Low delay, middle bit rate speech coder
EP0763818B1 (en) * 1995-09-14 2003-05-14 Kabushiki Kaisha Toshiba Formant emphasis method and formant emphasis filter device
US5963899A (en) * 1996-08-07 1999-10-05 U S West, Inc. Method and system for region based filtering of speech
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
US5924062A (en) * 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search
GB2352949A (en) * 1999-08-02 2001-02-07 Motorola Ltd Speech coder for communications unit
US6801931B1 (en) * 2000-07-20 2004-10-05 Ericsson Inc. System and method for personalizing electronic mail messages by rendering the messages in the voice of a predetermined speaker
SE521693C3 (sv) * 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
US7337110B2 (en) * 2002-08-26 2008-02-26 Motorola, Inc. Structured VSELP codebook for low complexity search
WO2004027754A1 (en) * 2002-09-17 2004-04-01 Koninklijke Philips Electronics N.V. A method of synthesizing of an unvoiced speech signal
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
AU2006208529B2 (en) * 2005-01-31 2010-10-28 Microsoft Technology Licensing, Llc Method for weighted overlap-add
US8725506B2 (en) * 2010-06-30 2014-05-13 Intel Corporation Speech audio processing
WO2012000882A1 (en) 2010-07-02 2012-01-05 Dolby International Ab Selective bass post filter
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
JP6077166B2 (ja) * 2016-07-10 2017-02-08 有限会社技研産業 放射線遮蔽材料及び放射線遮蔽建材

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL188189C (nl) * 1979-04-04 1992-04-16 Philips Nv Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting.
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
JPH0738119B2 (ja) * 1986-07-30 1995-04-26 日本電気株式会社 音声波形符号復号化装置
US5125030A (en) * 1987-04-13 1992-06-23 Kokusai Denshin Denwa Co., Ltd. Speech signal coding/decoding system based on the type of speech signal
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
CA2021514C (en) * 1989-09-01 1998-12-15 Yair Shoham Constrained-stochastic-excitation coding
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
JPH04207410A (ja) * 1990-11-30 1992-07-29 Canon Inc デジタルフイルタ装置
JPH06138896A (ja) * 1991-05-31 1994-05-20 Motorola Inc 音声フレームを符号化するための装置および方法

Also Published As

Publication number Publication date
GB2280828B (en) 1997-07-30
GB9420077D0 (en) 1994-11-23
CN1074846C (zh) 2001-11-14
GB2280828A (en) 1995-02-08
CA2132006A1 (en) 1994-09-01
JP2000155597A (ja) 2000-06-06
WO1994019790A1 (en) 1994-09-01
AU669788B2 (en) 1996-06-20
CA2132006C (en) 1998-04-28
DE4491015T1 (de) 1995-09-21
DE4491015C2 (de) 1996-10-24
SE9403630D0 (sv) 1994-10-24
JP3236592B2 (ja) 2001-12-10
FR2702075A1 (fr) 1994-09-02
US5434947A (en) 1995-07-18
AU6125594A (en) 1994-09-14
JP3070955B2 (ja) 2000-07-31
FR2702075B1 (fr) 1996-04-26
CN1104010A (zh) 1995-06-21
JPH07506202A (ja) 1995-07-06
SE9403630L (sv) 1994-12-21
BR9404230A (pt) 1999-06-15
US5570453A (en) 1996-10-29

Similar Documents

Publication Publication Date Title
JP3481251B2 (ja) 代数的符号励振線形予測音声符号化方法
SE517793C2 (sv) Sätt att åstadkomma ett spektralbrusviktningsfilter att använda i en talkodare
US5127053A (en) Low-complexity method for improving the performance of autocorrelation-based pitch detectors
SE518319C2 (sv) Förfarande och anordning för vektorkvantisering
EP2102619A1 (en) Method and device for coding transition frames in speech signals
CA2382575A1 (en) Variable bit-rate celp coding of speech with phonetic classification
EP1008982A1 (en) Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method
US5884251A (en) Voice coding and decoding method and device therefor
KR100257775B1 (ko) 다중 펄스분석 음성처리 시스템과 방법
US4890328A (en) Voice synthesis utilizing multi-level filter excitation
JPH09160596A (ja) 音声符号化装置
JPH05216500A (ja) 音声符号化装置
JP4063911B2 (ja) 音声符号化装置
US5797119A (en) Comb filter speech coding with preselected excitation code vectors
US5937374A (en) System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
JPH10143199A (ja) 音声符号化方法および復号化方法
JPH06131000A (ja) 基本周期符号化装置
JP3471889B2 (ja) 音声符号化方法及び装置
JPH08185199A (ja) 音声符号化装置
US5826223A (en) Method for generating random code book of code-excited linear predictive coding
JP3144194B2 (ja) 音声符号化装置
KR100366700B1 (ko) 코드여기 선형 예측 부호화에 있어서 상관함수에 기초한 적응 코드북 탐색방법
JPH09134196A (ja) 音声符号化装置
JP3112462B2 (ja) 音声符号化装置
JP2003029798A (ja) 音響信号符号化方法、音響信号復号方法、これらの装置、これらのプログラム及びその記録媒体

Legal Events

Date Code Title Description
NUG Patent has lapsed